Vědci jsou o krok blíže vytvoření umělé inteligence podobné člověku
foto: Pixabay/ilustrativní
Microsoft vyvinul model umělé inteligence, který dokáže zpracovávat obrázky. Podle jejich vědců se jedná o první krok ke kompletnímu nahrazení člověka na intelektuální rovině.
„Vědci Microsoftu v pondělí představili Kosmos-1, první umělou inteligenci (AI), která dokáže analyzovat obrázky, řešit optické puzzle a provádět vizuální rozpoznání textu, vizuální IQ testy a rozumí instrukcím v přirozeném jazyce,“ uveřejnil server Ars Technica.
Proč je to podstatné? Odborníci Microsoftu se domnívají, že na rozdíl od mediálně více propagovaných jazykových modelů tzv. large language models (LLM) modely multimodální AI by mohla být mnohem podobnější člověku. Cílem je vytvořit AI se schopností zpracovávat jak text, tak audio, video i obrázky. Tento postoj popsali ve studii Language Is Not All You Need: Aligning Peerception with Language Models. Podle představené teorie pro posunutí AI na lidskou úroveň musí zvládat nejen text, ale i jiné oblasti inteligence člověka. Právě Kosmos-1 je v tomto ohledu průlomem.
Psali jsme
Umělá inteligence se stává realitou. Počítačové systémy jsou již schopny komunikovat v přirozeném jazyce a do značné míry „pochopit“ obsah textu.…
Výsledky testování ukázali, že AI si vede dobře v rozpoznávání textu z obrázků, odpovídání na otázky ohledně jejich vlastností, vytváření názvů pro obrázky a dosahuje obstojných výsledků ve vizuálních IQ testech. Tento nový program je prototypem skupiny mutimodal large language model (MLLM), jenž pracuje na základě zpracování textu stejně jako LLM, ale navíc zvládne i optické úkoly. Nicméně obrázky se prvně musí přetransformovat do specifické série tokenů, aby jim AI porozuměla. V podstatě se přepíší na text. Konečným výsledkem těchto inovací by měla být AI schopná na intelektuální rovině nahradit člověka.
Zdroj obrázku: //arxiv.org/pdf/2302.14045.pdf
Tagy