Beszélj hozzám!

A szakértők azt jósolják, hogy az okos gépek hamarosan diákokat tanítanak, sebészeknek segítenek és autót vezetnek majd

Kapcsolódó cikkek

 

 “Hi, thanks for coming,” the medical assistant says, greeting a mother with her 5-year-old son. “Are you here for your child or yourself?”

The boy, the mother replies. He has diarrhea.

“Sorry to hear that,’’ she says, looking down at the boy. The assistant asks the mother about other symptoms, including fever (“slight”) and abdominal pain (“He hasn’t been complaining”).

She turns again to the boy. “Has your tummy been hurting?” Yes, he replies.

After a few more questions, the assistant declares herself “not that concerned at this point.” She schedules an appointment with a doctor in a couple of days. The mother leads her son from the room, holding his hand. But he keeps looking back at the assistant, fascinated, as if reluctant to leave.

Maybe that is because the assistant is the disembodied likeness of a woman’s face on a computer screen—a no-frills avatar. Her words of sympathy are jerky, flat and mechanical. But she has the right stuff—the ability to understand speech, recognize pediatric conditions and reason according to simple rules—to make an initial diagnosis of a childhood ailment and its seriousness. And to win the trust of a little boy.

“Our young children and grandchildren will think it is completely natural to talk to machines that look at them and understand them,” said Eric Horvitz, a computer scientist at Microsoft’s research laboratory who led the medical avatar project.

For decades, computer scientists have been pursuing artificial intelligence—the use of computers to simulate human thinking. But in recent years, rapid progress has been made in machines that can listen, speak, see, reason and learn, in their way.

The prospect, according to scientists and economists, is not only that artificial intelligence will transform the way humans and machines communicate and collaborate, but will also eliminate millions of jobs, create many others and change the nature of work and daily routines.

“Basic work that can be automated is in the bull’s-eye of both technology and globalization, and the rise of artificial intelligence just magnifies that reality,” said Erik Brynjolfsson, an economist at the Sloan School of Management at the Massachusetts Institute of Technology. Still, artificial intelligence will also spur innovation and create opportunities, Brynjolfsson says, just as the Internet has led to new businesses like Google and new forms of communication like blogs and social networking. Smart machines, experts predict, will someday tutor students, assist surgeons and safely drive cars.

– Üdvözlöm önöket – mondja az orvosi asszisztens az ötéves kisfiával belépő édesanyának. – A gyermekkel van valami baj, vagy önnek van problémája?

A fiamnak, feleli az anya. Hasmenése van.

– Ezt igazán sajnálom – mondja az asszisztens, és a fiúra pillant. Ezután a további tünetekről kérdezi az édesanyát, például a lázról („csak hőemelkedés”) és a hasfájásról („nem mondta, hogy fájna”).

Az asszisztens ismét a fiú felé fordul. – Fáj a pocid? – kérdezi. Igen, feleli a gyermek.

Néhány további kérdés után az asszisztens kijelenti, hogy „jelenleg nem találja aggasztónak a gyermek állapotát”, és bejegyzi az orvoshoz egy néhány nappal későbbi időpontra. Az anya kézen fogja és kivezeti a kisfiút, aki azonban vissza-visszanéz az asszisztensre, mintha nem akarna még távozni.

Ennek talán az az oka, hogy az asszisztens csupán testetlen női arc egy számítógép képernyőjén, vagyis egyfajta robot. Együtt érző szavai kissé szaggatottak, érzelemmentesek és gépiesek, ugyanakkor mindent tud, amit kell: megérti az emberi beszédet, képes a gyermekbetegségek felismerésére és arra is, hogy egyszerű szabályok alapján ésszerű döntéseket hozzon, azaz felállítsa az első diagnózist egy gyermekkori betegségről és annak súlyosságáról. És hogy elnyerje egy kisfiú bizalmát.

– Kisgyermekeink és unokáink számára már teljesen természetes dolog lesz, hogy olyan gépekhez beszéljenek, amelyek rájuk néznek és megértik őket – állítja Eric Horvitz, a Microsoft kutatólaboratóriumának számítástechnikai szakembere, az orvosiasszisztens-program vezetője.

A számítógéptudósok évtizedek óta dolgoznak a mesterséges intelligencia megalkotásán – vagyis arra kívánják használni a számítógépeket, hogy az emberi gondolkodást szimulálják. Az utóbbi években aztán jelentős előrelépéseket sikerült elérni azon gépek fejlesztése terén, amelyek a maguk módján képesek másokat meghallgatni, beszélni, látni, ésszerűen gondolkodni és tanulni.

Nemcsak arra kell számítani, vélik tudósok és közgazdászok, hogy a mesterséges intelligencia alapvetően megváltoztatja majd az emberek és gépek közti kommunikációt és együttműködést, hanem arra is, hogy miatta munkahelyek milliói szűnnek majd meg, igaz, sok új állás is keletkezik, és átalakulhat a munka és a mindennapi élet jellege is.

– A technika és a globalizáció is a célkeresztjébe vette már az automatizálható, egyszerű munkákat, és a mesterséges intelligencia előretörése csak gyorsítja ezt a jelenséget – mondja Erik Brynjolfsson, a Massachusettsi Műszaki Egyetem Sloan Vezetőképző Iskolájának közgazdásza. Ugyanakkor a mesterséges intelligencia lendületet ad majd az innovációnak, és új lehetőségeket is teremt, állítja Brynjolfsson, ahogyan az internet is új vállalkozásokat teremtett, például a Google-t, és új kommunikációs formákat, mint a közösségi oldalak vagy a blogok. A szakértők azt jósolják, hogy az okos gépek egy nap diákokat tanítanak, sebészeknek segítenek és autót vezetnek majd.

A Siri múltkor szusiétterem helyett
ázsiai kísérőlányokat ajánlott

Smarter Devices
“I’m looking for a reservation for two people tomorrow night at 8 at a romantic restaurant within walking distance.”

That spoken request seems simple enough, but for a computer to respond intelligently requires a ballet of more than a dozen technologies. A host of companies—AT&T, Microsoft, Google and startups—are investing in services that hint at the concept of machines that can act on spoken commands. They go well beyond voice-enabled Internet search.

Perhaps the furthest along is Siri, a Silicon Valley company offering a “virtual personal assistant,” a collection of software programs that can listen to a request, find information and take action.

In this case, Siri, presented as an iPhone application, sends an audio file to computers operated by Nuance Communications, the largest speech-recognition company, which convert it to text. The text is then returned to Siri’s computers, which make educated guesses about the meaning.

“It’s like the task faced by a waiter for whom English is a second language in a noisy restaurant,” said Tom Gruber, an artificial intelligence researcher and co-founder of Siri. “It isn’t perfect, but in context the waiter can usually figure out what you want.”

The Siri system knows the location of the phone and has rules for the meaning of phrases like “within walking distance.” It scans online restaurant review services like Yelp and Gayot for “romantic.”

Siri takes the winnowed list of restaurants, contacts the online reservation service OpenTable and gets matches for those with tables available at 8 the next day. Those restaurants are then displayed on the user’s phone, and the reservation can be completed by tapping a button on the screen. The digital dance can be completed in seconds—when it works.

Apple is so impressed that it bought Siri last April in a private transaction estimated at more than $200 million.

Nelson Walters, a television producer in New York, is a Siri fan. It saves him time and impresses his girlfriend. But occasionally, Walters said, Siri stumbles. Recently, he asked Siri for the location of a sushi restaurant. Siri replied with directions to an Asian escort service. “I swear that’s not what I was looking for,” he said.

Gruber said Siri had heard a Japanese name, but without knowing the restaurant context it guessed wrongly that the request was for a local business.

To the Rescue
“Please select one of the following products from our menu,” the electronics giant Panasonic used to tell callers seeking help with products. It was not working. It would take callers an average of two and a half minutes merely to wade through the menu, and 40 percent hung up in frustration. “We were drowning in calls,” recalled Donald Szczepaniak, vice president of customer service. Panasonic reached out to AT&T Labs in 2005 for help.

The AT&T researchers worked with thousands of hours of recorded calls to the Panasonic center in Virginia, to build statistical models of words and phrases that callers used to describe products and problems, and to create a database that is constantly updated. “It’s a baby, and the more data you give it, the smarter it becomes,” said Mazin Gilbert, a speech technology expert. The goal of the system is to understand words—among spoken phrases and sentences—so an automated assistant can intelligently reply.

“How may I help you?” asked the female voice in one recording.

“I was watching ‘American Idol’ with my dog on Channel 5,” a distraught woman on the line said, “and suddenly my TV was stuck in Spanish.”

“What kind of TV?” the automated assistant asked, suggesting plasma, LCD and other choices.

“LCD,” replied the woman, and her call was sent to an agent trained in solving problems with LCD models.

Simple problems—like product registration or where to take a product for repairs—can be resolved in the automated system alone. That technology has improved, but callers have also become more comfortable speaking to the system. A surprising number sign off by saying, “Thank you.”

Some callers make things easier for the computer by uttering a key phrase like “plasma help,” Mr. Szczepaniak said. “I call it the Google-ization of the customer,” he said.

Over all, half of the calls to Panasonic are handled in the automated system, up from 10 percent five years ago, estimated Lorraine Robbins, strategic planning manager.

But the other half of calls are more complex problems—like connecting a digital television to a cable box. In those cases, the speech recognition system routes a call to an agent trained on the product, so far more problems are resolved with a single call. Today, Panasonic resolves one million more customer problems a year with 1.6 million fewer total calls than five years ago.

The automated problem sorting has enabled Panasonic to globalize its customer service, with inquiries about older and simpler products routed to its call centers in the Philippines and Jamaica.

And while the center’s head count at 200 is the same as five years ago, the workers are more skilled these days. Antoine Andujar, a call center agent, attended electronics courses taught at the call center by instructors from a community college. He completed his electronics certification program last year, and continues to study. “You have to move up in skills,” he said. “At this point, you have to be certified in electronics to get in the door here as a Panasonic employee.”

Efficient Listener
“This call may be recorded for quality assurance purposes.” But at a growing number of consumer call centers, technical support desks and company hot lines, the listener is a computer. One that can recognize not only words but also emotions—and listen for trends in customer complaints.

In the telephone industry, for example, companies use speech recognition software to provide an early warning about changes in a competitor’s calling plans. By detecting the frequent use of names like AT&T and other carriers, the software can alert the company to a rival that lowered prices, for example. The companies then have their customer agents make counteroffers to callers thinking of canceling service.

Certain emotions are routinely detected at many call centers. VoiceSense, an Israeli developer of speech analysis software, has algorithms that measure a dozen indicators, including conversation pace and tone, to warn agents and supervisors that callers have become upset or volatile.

The real issue with artificial intelligence is how it will be used. Computers can be extremely good at skills that challenge the smartest humans, playing chess like a grandmaster. Yet those skills are in narrow domains of knowledge. What is far harder for a computer is understanding the context of language and social situations when talking—taking turns in conversation, for example. Unfamiliar words leave it baffled. Jokes, irony and sarcasm do not compute.

That brittleness can lead to mistakes. The medical assistant could make serious mistakes, like an incorrect diagnosis or a seriously ill child sent home. Smart machines, some warn, could be used as tools to isolate corporations and government from the rest of society. Instead of people listening to restive customers and citizens, it will be machines.

“Robot voices could be the perfect wall to protect institutions that don’t want to deal with complaints,” said Jaron Lanier, a computer scientist and author of You Are Not a Gadget.
Indeed, the increasing usefulness of artificial intelligence—answering questions, completing simple tasks and assisting professionals—means the technology will spread. It will be up to people to guide how it is used.

“It’s not human intelligence, but it’s getting to be very good machine intelligence,” said Andries van Dam, a professor of computer science at Brown University. “There are going to be all sorts of errors and problems, and you need human checks and balances, but having artificial intelligence is way better than not having it.”

Okosabb eszközök
– Holnap este 8 órára szeretnék két fő számára asztalt foglalni egy gyalog is elérhető romantikus étteremben.

Ez a szóban közölt kérés elég egyszerű, de ahhoz, hogy egy számítógép értelmes választ tudjon adni rá, több mint egytucatnyi technológia bonyolult összjátékára van szükség. Egész sor vállalat – köztük az AT&T, a Microsoft és a Google – fejleszt gőzerővel olyan szolgáltatásokat, amelyek a szóbeli utasításoknak engedelmeskedő gépekre épülnek. Persze itt sokkal többről van szó, mint az egyszerű hangvezérléses internetes keresésről.

A kutatásban a legmesszebb talán a Szilícium-völgyben működő Siri nevű cég jutott, amely immár „virtuális személyi titkárt” kínál – ez a programegyüttes képes meghallgatni a szóbeli kéréseket, felkutatni a megfelelő információt, és annak alapján cselekedni.

Amennyiben iPhone-alkalmazásként működik, a Siri az utasításról készített hangfájlt elküldi a legnagyobb hangfelismeréssel foglalkozó cég, a Nuance Communications számítógépeinek, amelyek a beszédet szövegfájllá alakítják át. A szöveget aztán visszaküldik a Siri számítógépeinek, amelyek igyekeznek kitalálni annak jelentését.

– Olyan ez, mint egy az angolt második nyelvként beszélő pincér dolga egy zajos étteremben – mondja Tom Gruber, a Siri egyik alapítója. – Nem érti tökéletesen a vendég szavait, de az adott szövegkörnyezetben általában felfogja, mit akarnak tőle.

A Siri rendszere azonosítja a telefon helyét, és szabályai vannak az olyan kifejezések értelmezésére, mint a „gyalog is elérhető”. A „romantikus” vendéglők megtalálásához az olyan internetes étteremminősítő szolgáltatások oldalait nézi át, mint a Yelp vagy a Gayot.

A Siri ezután fogja a kritériumoknak megfelelő éttermek listáját, felveszi a kapcsolatot az OpenTable nevű internetes asztalfoglalási szolgáltatással, és megtudja, hol van még szabad kétfős asztal másnap este 8-ra. Ezen éttermek neve jelenik meg a felhasználó telefonján, a helyfoglaláshoz pedig elég megnyomni egy gombot a kijelzőn. A „digitális tánc” néhány másodperc alatt lejátszódhat – feltételezve, hogy helyesen működik.

Az Apple céget annyira lenyűgözte ez a szisztéma, hogy tavaly áprilisban felvásárolta a Sirit – az ár becslések szerint a 200 millió dollárt is meghaladhatta.

Nelson Waters New York-i tévéproducer nagy rajongója a Sirinek. Határozottan állítja, hogy a rendszer időt takarít meg neki, és a barátnőjét is el tudja kápráztatni vele. Walters szerint azonban a Siri néha félreérti a feladatot. Nemrégiben például egy szusiétterem címét kérte, de a rendszer egy ázsiai kísérőlányokat közvetítő szolgáltatáshoz irányította. – Pedig esküszöm, hogy nem azt kerestem – bizonygatja.

Gruber szerint a Siri helyesen értelmezte, hogy japán szóról van szó, de azt nem sikerült megállapítania, hogy Gruber étteremre gondolt, és arra a téves következtetésre jutott, hogy a kérés egy más jellegű helyi vállalkozásra vonatkozik.

Segít a számítógép
– Kérem, válasszon egyet az alábbi menüben felsorolt termékeink közül – szólt a Panasonic elektronikai óriás terméktámogatási vonalának beköszönő szövege. Csakhogy nem működött. A hívóknak átlagosan két és fél percbe telt, mire a menü végére jutottak, és 40 százalékuknak nem is volt türelme ezt végigvárni. – Izzottak a telefonvonalaink – emlékszik vissza Donald Szczepaniak ügyfélszolgálatért felelős alelnök. A Panasonic végül 2005-ben az AT&T Labstől kért segítséget.

Az AT&T kutatói feldolgoztak több ezer órányi, a Panasonic virginiai központjában a hívásokról készített hangfelvételt, hogy statisztikai modellt készítsenek a hívók által a termékek és problémák leírásakor leggyakrabban használt kifejezésekről, majd létrehoztak egy folyamatosan frissített adatbázist. – Még csak embrionális állapotban van, de minél több adatot tanítunk meg neki, annál okosabb lesz – magyarázza Mazin Gilbert beszédtechnológiai szakember. A cél az, hogy rendszer megértse a beszélt szövegben elhangzó szavakat, és azok alapján az automata segélyszolgálat értelmes választ tudjon adni.

– Miben segíthetek önnek? – kérdezi a női hang az egyik felvételen.

– A kutyámmal az „American Idolt” néztük az ötös csatornán – mondja a vonal túlsó végén egy kétségbeesett női hang –, amikor a tévém egyszer csak átkapcsolt spanyol nyelvre, és azóta is úgy van.

– Milyen fajta tévéről van szó? – kérdezi az automata asszisztens, s választási lehetőségként a plazma, az LCD vagy egyéb készülékeket kínálja fel.

– LCD – feleli a nő, mire a hívást egy az LCD modellek problémáinak megoldásában járatos ügyfélszolgálatos szakemberhez kapcsolják tovább.

Az olyan egyszerű feladatokat, mint a termékregisztráció vagy a szervizek címének megadása az automata rendszer önállóan is képes megoldani. Sokat fejlődött a technika, de ma már a hívókat is kevésbé zavarja, hogy ilyen rendszerhez kell beszélniük. Meglepően sokan zárják a beszélgetést „Köszönöm”-mel.

– Egyes hívók meg is könnyítik a számítógép dolgát azzal, hogy olyan kulcskifejezéseket mondanak ki, mint „plazma, segítség” – magyarázza Szczepaniak. – Én ezt úgy nevezem, hogy az ügyfeleink „guglisodnak”.

Lorraine Robbins, a cég stratégiai tervezésért felelős vezetője szerint a Panasonichoz beérkező hívásoknak ma már a felét kezeli az automata rendszer, míg öt éve alig tíz százalék volt ez az arány.

A hívások másik fele azonban összetettebb probléma, például hogyan kell a digitális televíziót a set-top boxhoz csatlakoztatni. Ilyen esetekben az automata az adott terméket jól ismerő szakemberhez kapcsolja a hívást, így sokkal több problémát lehet egyetlen telefonálással elintézni. A Panasonicnál ma évente egymillió ügyfélproblémát oldanak meg, és ehhez 1,6 millióval kevesebb telefonhívásra van szükség, mint öt éve.

Az automatizált problémamegoldásnak köszönhetően a Panasonic globalizálhatta ügyfélszolgálatát, és a régebbi, illetve egyszerűbb készülékekkel kapcsolatos kérdéseket ma már a Fülöp-szigeteki és jamaicai call centereibe irányítják át.

És bár a központokban ma ugyanúgy 200-an dolgoznak, mint öt éve, a munkatársak sokkal képzettebbek. Antoine Andujar, az egyik ügyfélszolgálatos például elvégzett több főiskolai tanárok által vezetett elektronikai tanfolyamot. Tavaly elektronikai képesítést szerzett, de jelenleg is tanul. – Állandóan tovább kell képeznünk magunkat – mondja. – Ma már ott tartunk, hogy elektronikai képzettség nélkül nem is lehet senki a Panasonic itteni alkalmazottja.

Figyelmes hallgató
„Erről a telefonbeszélgetésről minőségbiztosítási célból hangfelvétel készülhet.” De egyre több fogyasztói ügyfélszolgálatra, terméktámogatási központra és vállalati forródrótra igaz, hogy a vonal másik végén számítógép hallgatja az ügyfelet. Olyan számítógép, amely a szavak mellett érzelmeket is képes felismerni, sőt figyeli a hívók panaszaiban előforduló trendeket.

A telefontársaságok például beszédfelismerő szoftvert használnak arra, hogy idejében figyelmeztessék őket a konkurencia terveire. Például ha azt észlelik, hogy a beszélgetésekben gyakran szerepel az AT&T vagy más telefontársaság neve, az a konkurenciánál bekövetkezett árcsökkentésre hívhatja fel a figyelmet. Erre válaszként saját ügyfélszolgálati munkatársaik telefonon kereshetik meg a váltáson gondolkodó ügyfeleket, hogy kedvező ellenajánlatot tegyenek.

Sok call centerben már rutinszerűen észlelnek bizonyos érzelmeket. A VoiceSense nevű, beszédelemző szoftvereket fejlesztő izraeli cég algoritmusai például tucatnyi tényezőt figyelnek, köztük a beszélgetés tempóját és a hívó hanghordozását, és figyelmeztethetik a telefonkezelőket, hogy a hívó idegessé vagy erőszakra hajlamossá vált.

A mesterséges intelligenciával kapcsolatban az a legfontosabb kérdés, hogy miként fogják alkalmazni. A számítógépek rendkívül hatékonyak lehetnek bizonyos, a legokosabb ember számára is nehéz feladatokban – például nagymesteri szinten sakkozhatnak. E feladatok azonban a tudás egy igen szűk területére korlátozódnak. Sokkal keményebb dió az, hogy a számítógépek helyesen értelmezzék a nyelvi és szociális környezetet – például beszélgetés közben a megfelelő pillanatban vegyék, illetve adják át a szót. Az ismeretlen szavakkal például nem tudnak mit kezdeni, a tréfa, az irónia vagy éppen a szarkazmus pedig felfoghatatlan számukra.

Márpedig ezek a hiányosságok hibákat okozhatnak. Az orvosi asszisztens nagy hibákat véthet, például helytelen diagnózist állíthat fel, vagy hazaküldhet egy súlyosan beteg gyermeket. Egyesek pedig arra figyelmeztetnek, hogy az okos gépek a vállalatok és a kormány társadalomtól való elszigetelésének eszközeivé válhatnak. Emberek helyett gépek hallgatnák a panaszos polgárokat.

– A robothangok tökéletes falat alkothatnak azon intézmények védelmére, amelyek nem akarnak panaszokkal foglalkozni – mondja Jaron Lanier számítástechnikai kutató.
Tény, hogy a mesterséges intelligencia növekvő hasznossága – válaszadás kérdésekre, egyszerű feladatok elvégzése, illetve segítségnyújtás a szakembereknek – miatt a technológia terjedni fog. Az viszont az embereken múlik, milyen módon használják fel.

– Nem emberi értelemről van szó, hanem egyre kitűnőbben működő gépi intelligenciáról – magyarázza Andries van Dam, a Brown Egyetem számítástechnika-professzora. – Mindig is lesznek problémák a működésében, ezért emberi ellenőrzésre és ellensúlyozásra van szükség, de a mesterséges intelligenciával így is sokkal jobb lesz, mint nélküle.

Vote it up
313
Tetszett?Szavazzon rá!