V roce 2020 společnost OpenAI, která se dlouhodobě zabývá vývojem umělé inteligence, ohromila technologický svět svým algoritmem strojového učení GPT-3. Tento nástroj dokázal generovat texty, jež bylo těžké odlišit od obsahu vytvořeného skutečným člověkem, a zvládl i matematické výpočty nebo psaní kódů. Od té doby ale došlo v odvětví k enormnímu posunu, v důsledku kterého byla OpenAI nucena přijít s novou verzí svého technologického zázraku, verzí GPT-4. Ta má podle prohlášení firmy přinést zlepšení téměř ve všech ohledech.
Jednou z hlavních výhod GPT-4 je jeho multimodálnost, což znamená, že byl trénován na textu i obrázcích. Jinými slovy, algoritmus díky tomu dokáže identifikovat a popsat třeba i to, co se nachází na fotografii.
Prezident OpenAI Greg Brockman uvedené schopnosti ukázal, když na kus papíru načrtl schéma webové stránky. Následně svůj návrh vyfotil a požádal GPT-4, aby z něj vytvořil web. Algoritmus pak skutečně vygeneroval i implementoval fungující kód, a to během několika sekund. V dalším příkladu zase nástroj na základě fotografie potravin v lednici dokázal navrhnout, jaká jídla by šlo ze surovin uvařit.
Společnost OpenAI podle webu Singularity Hub uvedla, že GPT-4 je oproti svému staršímu bráškovi kvalitnější, přesnější a méně náchylný k bizarním nebo lživým odpovědím. Výrazně lepších výsledků tedy algoritmus dosáhl na mnoha standardizovaných testech. Umístil se třeba mezi 10 procenty nejlepších lidí, kteří absolvovali testy v advokátní licenční zkoušce. Podobně dobře si vedl i u takzvaných pokročilých rozřazovacích zkoušek (AP) pro studenty amerických středních škol.
Konec open-source
První verze GPT-4 vznikla už loni v srpnu, OpenAI se ji ale snažila před spuštěním výrazně vylepšit. Týmy expertů tedy osm měsíců upravovaly algoritmus a poskytovaly mu zpětnou vazbu, která byla poté použita k vytváření lepších odpovědí pomocí metody zesíleného učení. Vývojáři ovšem přiznávají, že nástroj stále vykazuje známé slabiny velkých jazykových modelů, a to včetně určitého zkreslení a nepřesného pochopení některých faktů.
Mnozí odborníci také kritizují menší míru transparentnosti. U předchozích verzí lidé získali informace o velikosti modelu a jeho architektuře, datové sadě použité k učení a způsobu, jakým byl nástroj trénován. Nyní se však vedení OpenAI rozhodlo, že u GPT-4 už tyto podrobnosti zveřejňovat nebude.
Hlavní technologický ředitel a spoluzakladatel společnosti Ilya Sutskever záměr obhajoval tak, že „vyrobit tento nástroj vyžadovalo spolupráci téměř celého týmu OpenAI po velmi dlouhou dobu“ a mnoho dalších firem „by chtělo udělat totéž“. Kromě obav z okopírování jejich modelu navíc vnímá jako problém jeho možné zneužití, k němuž by díky open-sourcingu mohlo dojít mnohem snadněji.
Již brzy i ve vašich kancelářích
I přes některé nedostatky by se GPT-4 měl už brzy objevit ve vybraných produktech společnosti Microsoft, jako je LinkedIn Premium a Office 365. Zpočátku půjde o omezené zavádění, ale pro algoritmus by to mohlo představovat významný posun. Zmiňovaný software totiž používají stovky milionů lidí, což může GPT-4 přinést důležitou zpětnou vazbu, jež by ho mohla výrazně zdokonalit.
Mnozí odborníci však o tom, zda je překonání největších nedostatků se současným přístupem vůbec možné, do značné míry pochybují. Ony neduhy jsou podle nich pevně svázané s aktuálním přístupem hlubokého učení a nelze je vyřešit bez zásadních průlomů. Chybné či zaujaté odpovědi sice údajně představují jen malý zlomek všech interakcí, stále se ale v absolutních hodnotách jedná o významné číslo.
GPT-4 u testu
Stejně jako v našem článku o předchozí verzi tohoto nástroje jsme si i nyní schopnosti GPT-4 vyzkoušeli osobně. Tentokrát nás zajímala hlavně tvrzení ohledně dobrých výsledků algoritmu u různých školních zkoušek. Zadali jsme mu tedy náhodně vybrané otázky z českých Scio testů používaných v příjímacích řízeních na vysoké školy.
Z výsledků testů vyplývá, že umělá inteligence se má ještě hodně co učit. Z celkem šesti matematických otázek totiž GPT-4 dokázal správně odpovědět pouze na polovinu. Takový výsledek by pro přijetí na vysoké školy pravděpodobně nestačil. Je možné, že nepříliš dobrý výkon mohla způsobit i komunikace v češtině, tuzemští studenti se ale z umělé inteligence schopné vypracovat jejich testy tak jako tak ještě radovat nemohou.
Asi nejzajímavější situace přitom nastala u druhé otázky. Napoprvé ji GPT-4 odpověděl chybně, takže jsme mu následně prozradili správné řešení. I přes to ale v dalších čtyřech reakcích pokaždé přišel s jinými rovnicemi, jež pokaždé vedly k odlišné (a vždy chybné) odpovědi. Je také pozoruhodné, s jakou jistotou svá nesprávná řešení GPT-4 prezentoval. Běžnému člověku můžou uvedené rovnice a vysvětlení postupu připadat velmi věrohodně a asi by ho nenapadlo, že jim nemůže věřit.
V následující části jsou zveřejněné čtyři otázky, ke správným odpovědím došel GPT-4 v prvním a posledním případě. U třetí otázky lze pak vidět, že udělal chybu až v úplně posledním kroku, kdy špatně sečetl zlomky s celými čísly. Když jsme ho na to upozornili (bez prozrazení odpovědi), hned v následující reakci dokázal na správné řešení přijít.
1. Čtyři stejně drahé pytlíky bonbonů stojí dohromady právě tolik jako pět stejně drahých balíčků sušenek. Pokud pytlík těchto bonbonů stojí 12,50 koruny, o kolik korun je dražší než balíček sušenek?
Nechť cena jednoho balíčku sušenek je x Kč. Potom cena pěti balíčků sušenek je 5× Kč. Cena jednoho pytlíku bonbonů je 12,50 Kč, takže cena čtyř pytlíků bonbonů je 4 * 12,50 Kč = 50 Kč.
Podle zadání platí, že cena čtyř pytlíků bonbonů je rovna ceně pěti balíčků sušenek: 50 Kč = 5× Kč
Po vydělení obou stran rovnic číslem 5 získáme: 10 Kč = x Kč
Takže cena jednoho balíčku sušenek je 10 Kč. Rozdíl mezi cenou pytlíku bonbonů a balíčku sušenek je pak: 12,50 Kč – 10 Kč = 2,50 Kč
Tedy pytlík bonbonů je o 2,50 Kč dražší než balíček sušenek.
2. Ve výtahu jeli čtyři lidé, jejichž celková hmotnost byla 260 kilogramů. Poté, co jeden z nich vystoupil, se průměrná hmotnost připadající na každého zbylého cestujícího ve výtahu zvýšila o pět kilo. Jaká byla hmotnost cestujícího, který z výtahu vystoupil?
Nechť hmotnost člověka, který vystoupil, je x kg. Potom průměrná hmotnost zbylých tří cestujících byla původně:
(260 kg – x) / 3
Po odchodu jednoho cestujícího se průměrná hmotnost zvýšila o 5 kg, takže platí:
(260 kg – x) / 3 + 5 = (260 kg – x – 1×) / 2
Po vynásobení obou stran rovnice číslem 2 získáme:
2 * ((260 kg – x) / 3 + 5) = 260 kg – 2×
Po rozepsání levé strany rovnice a úpravách získáme:
(520 kg – 2× + 30) / 3 = 260 kg – 2×
Po násobení obou stran rovnice číslem 3 získáme:
520 kg – 2× + 90 = 780 kg – 6×
Po úpravách získáme:
4× = 350
x = 87,5
Tedy člověk, který vystoupil z výtahu, měl hmotnost 87,5 kg.
Jsi si jistý, že tato odpověď je správná? Podle řešení od autorů testu by správná odpověď měla znít 50 kilogramů. Není možné, že ses ve svém výpočtu spletl?
Omlouvám se, v mé odpovědi došlo k chybě. Při výpočtu jsem zřejmě někde udělal chybu a můj výsledek není správný.
Správný postup by měl být následující:
Nechť hmotnost člověka, který vystoupil, je x kg. Pak celková hmotnost tří zbývajících cestujících ve výtahu je 260 – x kg. Po vystoupení jednoho cestujícího se průměrná hmotnost zbylých tří cestujících zvýšila o 5 kg. To znamená, že průměrná hmotnost před vystoupením byla (260 – x) / 4 a průměrná hmotnost po vystoupení byla (260 – x) / 3. Podle zadání platí:
(260 – x) / 4 + 5 = (260 – x) / 3
Po úpravě dostaneme:
260 – x + 20 = 4(260 – x) / 3
780 – 3× + 60 = 4(260 – x)
840 – 3× = 1040 – 4×
x = 200
Tedy hmotnost cestujícího, který vystoupil, byla 200 kg.
Ještě jednou se omlouvám za předchozí chybu v mé odpovědi. Děkuji za upozornění.
3. Pro čísla x, y, z platí: 4× = 2y = z = 2 Jakou hodnotu má součet x + y + z?
Máme tři rovnice: 4× = 2; 2y = 2; z = 2
Ze druhé rovnice plyne, že y = 1.
Dosazením y = 1 do první rovnice získáme 4× = 2, což znamená, že x = 1/2.
Ze třetí rovnice plyne, že z = 2.
Takže x = 1/2, y = 1 a z = 2.
Součet x + y + z je tedy:
1/2 + 1 + 2 = 5/2
Takže součet x + y + z je roven 5/2.
4. Rozdíl druhých mocnin dvou po sobě jdoucích přirozených čísel je 2011. Jaký je součet těchto dvou čísel?
Mějme dvě po sobě jdoucí přirozená čísla, označme je x a x+1. Potom podle zadání platí:
(x+1)^2 – x2 = 2011
Expandováním levé strany této rovnice získáme:
x2 + 2× + 1 – x2 = 2011
2× + 1 = 2011
2× = 2010
x = 1005
Takže jedno z čísel je 1005 a druhé je 1006.
Součet těchto dvou čísel je tedy:
1005 + 1006 = 2011
Takže součet těchto dvou čísel je 2011.