Stroj zvládne řízení auta, rozpoznávání obličejů i StarCraft lépe než my, tvrdí expert

Lukáš Neumann nedávno získal prestižní vědecké ocenění Česká hlava za svůj výzkum v oblasti umělé inteligence. Zeptali jsme se ho, na co vlastně přišel, jak vnímají stroje a v čem se liší práce na Oxfordu.


Umělou inteligenci vyučuješ, tvoříš a dostáváš za ní ceny. Proč?

Umělá inteligence mě zajímala dávno před akademickou dráhou – chtěl jsem zkoumat něco na hraně poznání. AI vnímám jako historický mezník v programování. Nejprve byl uživatel a programátor tentýž člověk. Ve druhé fázi se to oddělilo a programátor tvořil, co jiní uživatelé potřebovali. Při využívání umělé inteligence programátor v klasickém slova smyslu už není potřeba – člověk má nějakou potřebu a stroj je schopen ji pochopit a naučit se ji vyřešit.

Typickou aplikací je dnes třeba digitalizace dokumentů pomocí metody OCR, kdy program automaticky přečte dokument (např. fakturu) a výstupem je text. Já se teď zabývám další úrovní, které se říká čtení textu v živých scénách. To umožňuje číst a vyhodnocovat text v neuspořádaném prostředí (v reálném světě či v obrazech) a nabízí celou řadu praktických využití.

Pomoci může například nevidomému, který může namířit svůj mobil nějakým směrem a nechat si situaci či přítomný text „přečíst“. Stejně tak mnoho lidí ocení podobné aplikace při pobytu v cizině, zejména v exotických zemích. Namíříte text na menu v Číně a hned uvidíte, jestli si objednáváte kuře po sečuánsku nebo slepičí pařát. Lidské smysly jsou stále ještě oblastí, kde má člověk oproti strojům navrch, ale ten rozdíl se rychle snižuje.

 

Máš představu, kdy se i tohle změní?

Tak v některých oborech už ta změna nastala. Například v rozpoznávání obličejů, kde si člověk pamatuje maximálně tisíc tváří a pak jeho kapacita končí, už vede umělá inteligence. Často se uvádějí i různé hry a řešení problémů – a to nejen Scrabble nebo Go. Zrovna před týdnem rozdrtil program Googlu AlphaStar nejlepšího hráče StarCraftu. Na druhou stranu tento týden zase robot IBM prohrál na celé čáře v debatě s diskuzním profesionálem, takže rezervy tam určitě ještě jsou.

Zdroj: Česká hlava

Mohl bys vysvětlit, jak se ti podařilo dostat na Oxford?

Na ČVUT FEL jsem napsal diplomovou práci na rozpoznávání textu – ta vyhrála několik ocenění (např. diplomová práce roku) a já pokračoval na doktorát. Mého výzkumu rozpoznávacích metod a strojového učení si všiml Google a rozhodl se podpořit můj výzkum v rámci programu Google Fellowship.

Během doktorského studia byl můj příspěvek na zahraničních konferencích ohledně rozpoznávání textu dvakrát zvolen za nejlepší a možná i díky tomu mi přišla nabídka z University of Oxford. Na oxfordské Katedře informačního inženýrství zkoumám vidění strojů, tvořím algoritmy pro autonomní vozy a vyučuji umělou inteligenci.

 

Jaký je podle tebe největší rozdíl mezi výukou v ČR a na Oxfordu?

Rozhodně to, že studenti berou výuku více vážně. Běžná je mnohem vyšší příprava před cvičením, které trvá podstatně déle něz u nás, a na konci se odevzdává hotový projekt či report, který se obratem hodnotí a promítá do známky. Semestr je o něco kratší a intenzivnější.

 

Nedávno jsi získal prestižní cenu Česká hlava v kategorii technické vědy. Jaké jsi měl dojmy z vyhlášení?

Překvapilo mě, jak uvolněná atmosféra tam byla. Moderétor Daniel Stach je navíc fakt profík – bavili jsme se už během příprav a má fakt ohromný přehled. Česká hlava ale hlavně ukazuje, že se u nás dělá špičková věda v různých oborech. Ostatní ocenění jsou také příjemní a inspirativní lidé, takže jsme zůstali v kontaktu a nedávno jen tak zašli na pivo.

Zdroj: Česká hlava

Na čem právě pracuješ? Můžeš uvést konkrétní příklady?

Aktuálně se zabývám především viděním strojů a vytvářím algoritmy pro autonomní vozy. U jejich programování řešíme dvě věci – senzoriku tj. „dobré vidění“ vozu, a potom rozohodovací část (jak vůz řeší různé situace). Já se zabývám tou první částí a hledám způsoby, jak zaručit co nejvyšší bezpečnost a spolehlivost. Auto musí dobře vidět a predikovat překážky. Jeho možnosti jsou ale fyzikálně omezené – vůz obvykle využívá jen radar a kamery. Situaci také komplikuje pohyb auta, světelné podmínky, déšť a je asi jasné, že ani 99% spolehlivost nám nemůže stačit.

Vedle toho mám v MEMOS Software na starosti umělou inteligenci a rozvoj našeho produktu REDQUE, což je aplikace, která pomáhá firmám automaticky zpracovávat dokumenty a zbavit se chyb i administrativy.

 

Máš představu, jak dlouho bude trvat, než budou samořiditelná auta úplně běžná?

Já většinou říkám, že můj syn, kterému jsou 3 roky, si už řidičák nebude muset dělat.

 

Zmínil jsi automatizaci ve firmách – co všechno jde automatizovat?

Obecně všechny opakované procesy – nelze automatizovat umění, kreativní práci či produkty přesně na míru. Cokoliv pravidelného lze ale automatizovat, optimalizovat a tím zvýšit výkon i ušetřit náklady. A to zahrnuje administrativu, komunikaci, řízení, marketing… Nejčastějším využitím umělé inteligence a rozpoznávacích metod, je výstupní kontrola kvality ve výrobě.

 

Napadají tě další trendy v praktickém využití umělé inteligence?

V poslední době roste využívání umělé inteligence k ochraně soukromí. Současná legislativa nařizuje podnikům zabezpečit citlivá data. Přitom se ve firmách data a dokumenty často válejí všude možně a podniky samy ani nevědí, kde všude jim mohou unikat. Algoritmus umí citlivé údaje snadno rozpoznat, najít je a dále zabezpečit, např. šifrováním, archivací či smazáním z míst, kam ta data nepatří.

 

Jaká jsou největší úskalí? Proč se některé firmy brání využívat nové technologie?

Lidé obvykle nemají k počítačům důvěru, zejména pokud nejsou technicky založení, a zároveň se obávají o svá pracovní místa. Jenomže spolehlivost strojů je v případě správné aplikace podstatně vyšší než u člověka, a v historii se vždy ukázaly podobné obavy jako liché. Ano, některá pracovní místa zanikají, ale jiná naopak vznikají. Ideálem samozřejmě je delegovat na stroje většinu těžké, nudné, repetetivní či nebezpečné práce, a věnovat se jejich řízení, rozhodování či kreativní činnosti.

 

Napadají tě ještě nějaké zajímavé projekty poslední doby?

Vlastně není tak úplně pravda, že počítače nemohou „dělat umění“. Existují již pokročilé aplikace na kreativní a umělecké transformace. Můžete jim například ukázat Rembrandtův obraz společně se svou fotografií a získáte svůj portrét namalovaný jako od Rembrandta.

Více o Lukášově činnosti se dozvíte v záznamu vysílání České televize (od 13. minuty).

Lukáš Neumann těsně po obdržení ceny Česká hlava 2018. Nezdá se, že by se zlobil.

Autor: Daniel Bohuslav
Lukáš Neumann, Softwarový inženýr a výzkumník na University of Oxford

Lukáš je tím, kým byste chtěli být, pokud se zabýváte umělou inteligencí. Je autorem globálně uznávaných publikací, jeho výzkum (jako jediný ve střední Evropě) podpořil Google, jeho algoritmus na rozpoznávání textu koupil pro svá chystrá zařízení Samsung a nedávno mu bylo uděleno nejvyšší vědecké ocenění Česká hlava.

V současnosti působí na Oxfordské univerzitě, kde se věnuje výzkumu autonomních vozů, a zároveň působí jako expert na umělou inteligenci ve firmě MEMOS Software, kterou před patnácti lety spoluzakládal. Stojí za úspěšným produktem REDQUE, který automaticky zpracovává firemní dokumenty, a dost nerad se chlubí, takže to musíme dělat za něj.

Vyvíjíme software v Praze i v Plzni

Působíme na trhu od roku 2003, máme za sebou přes 1000 úspěšných projektů a neustále vyvíjíme nová řešení, která pomáhají firmám fungovat efektivněji a snáze dosáhnout svých cílů. Rádi usnadníme práci také Vám.

Zpět na blog

MEMOS Software s.r.o.

  • +420 222 560 345
  • Na Královce 31/4 Praha 10 - Vršovice
  • Číslo účtu:1306363001/5500
  • IČ:27093930
  • DIČ:CZ27093930
  • Zapsáno v OR ved. MěS oddíl C, vložka 95772