Rubrika: Co je možné s AI?

Generování obrazu

Vyrobit si promptem téměř dokonalý obrázek a stát se tak kreativním digitálním malířem je dechberoucí zážitek…příkladů efektivního komerčního nasazení však – snad s vyjímkou marketingu – najdeme v porovnání s ostatnními doménami poměrně málo. Jde o krásné obrázky, ale zatím jsou jen krásné, nejsou přesné, leckdy fyzikálně správné (vysvětlím v textu dále). Digitálně malovat rozhodně…
Generování audia a videa

Audio a video jsou další oblasti, které se (zatím) těší menšímu zájmu, nicméně jde o dnešní status a vše dál bude záležet na přílivu peněz. Zejména u videa je ale zájem zřejmý a dá se očekávat, že většina hráčů na poli obrázků do videa brzy naplno nastoupí. Audio Technologie AI Audia se postará o bezztrátovou…
Generování hlasu

Generování hlasu je velmi efektní způsob přepisu mluveného slova na text (Speech-to-Text, STT) a naopak (Text-to-Speech, TTS). Na rozdíl od počítačového vidění je generování hlasu relativně jednoduchou machine learning doménou. Hlas je totiž jednodimenzionální na jedné frekvenční ose, protože digitální záznam zvuku není nic jiného než jen proud čísel (Hz frekvecí). Jedinou náročnost v této…
Počítačové vidění

Počítačové vidění (Computer Vision, CV) je jednou z nejvíce perspektivních a nejplodnějších oblastí zájmu v business světě. Proč a co všechno se za Computer Vision schovává? Řekneme si, poinspirujeme se, a že se jedná o důležité teritorium AI, nahlédneme tentokrát více pod pokličku fungování. To, že počítač dnes dokáže „vidět“, bylo ještě před 10 lety…
Generování textu 1/3

Na počátku bylo slovo. V listopadu 2022 široká veřejnost poprvé vyzkoušela jazykový model ChatGPT a ten svou schopností chápat a formulovat komplexní texty všem vyrazil dech a definitivně odšpuntoval masové nadšení z AI. Od té doby jazykové modely přibývají, exponenciálně se zlepšují a nabalují obrovskou revoluci s rozsáhlými sociálně-ekonomickými dopady, které jako společnost budeme teprve…
Generování textu 2/3

V této kapitole si řekneme něco víc o prompt engineeringu, tedy technikách promptování velkých jazykových modelů (LLM), jejichž prostřednictvím budeme model instruovat a výstupy ladit k našim představám, což je naprosto elementární pro jakoukoliv implementaci do firemního prostředí. Pro trénování prompt engineeringu potřebujete pracovat nad samotným jazykovým modelem, například nad GPT od OpenAI. Pozor, nejde…
Generování textu 3/3

V této kapitole si řekneme, jak postavit chatbota nad vlastními daty, tedy automat schopný vést plynulou konverzaci (chat). Chatbota budeme opět stavět přímo nad LLM, například v OpenAI Platformě anebo v Azure OpenAIStudio (Microsoft). Fungování chatbota stojí na schopnosti modelu sáhnout do poskytnutých dokumentů a dat, která mu předám, přitom si je kvůli velikosti nemusí…