100 dnů s AI a Martinem

Den 14/100, Postavte si vlastní AI, na vlastních dokumentech. O čem se bavím, o RAG, o možnosti postavit si vlastní AI nad vlastními dokumenty či knowledge base, které pracuje s vašimi daty, klidně i na open source nástrojích a databázích, ale k tomu se ještě vrátím.

Dívám se na Alza.cz, vrátil jsem širokoúhlý objektiv k mémy foťáku Sony ZV-1 prostě proto, že tahat foťák ven je nepraktické, a celý ten objektiv stál skoro to samé co kamera Insta 360 Go, na kterou jsem viděl recenzi na YouTube. Čím dál více vidím, že pokud člověk chce tvořit obsah, chce to něco malého a praktického, nicméně čínskou značku DJI, která špehuje v mobilní aplikaci, a proto není v Google Play, vyřazuji.

Ještě nakupuji na Alze, a koukám na nákup za třetinku, prý berúročně. Docela rád si beru bezúročné půjčky, klidně i od mobilních operátorů, i když peníze mám, přijde mi zbytečné platit hned, když nemusím. Koukám, že se Alza dost zlepšila, před pár lety po mě chtěli ručitele za částku 10.000 Kč, to jsem se na ně díval tak, jako jestli to fakt myslí vážně. Teď už si vše ověří přes BankID, a takové blbosti nevyžadují.

Vraťme se k AI. Co jsem teď začal studovat je LangChain, hledal jsem k tomu nějaký tutoriál, a nejdřív jsem našel něco od nějakého Inda, ale bylo to moc hands-on, prostě typu naklikej si to takhle, a o to jak to funguje se nezajímej. Pak jsem našel tuhle oficiální sérii přímo od LangChain https://youtu.be/wd7TZ4w1mSw?si=lPQpBsTJcao4d3Tk - “RAG From Scratch” a začal si to procházet. Ještě dneska bych si chtěl nainstalovat Jupyter notebook a projít si i příklady, a udělat si praktickou zkušenost.

Co mi přijde zajímavé jsou ty vekterové databáze, vektorová databáze ukládá (světe div se) vektory, a její síla je v tom, že dokáže vyhledávat podle vzdálenosti vektorů. Asi bych se dostával moc do detailů toho, jak funguje AI a LLM (pokud nevíte, nastudujte si to), ale veskrze do vektorové databáze jste schopni si uložit vaše dokumenty jako vektory (tzv. embedding), a ty pak přidat jako kontext k vašemu dotazu. Víc v tom moc nehledejte.

Proč tohle používat? Představte si, že chcete dohledat nějaký zákon, klasická umělá inteligence má nějaké právo nastudováno, ale ty zákony úplně nejsou aktuální, a může to i trochu kecat. Díky RAG si můžete stáhnout aktuální zákoníky třeba z www.e-sbirka.cz , a ty pak integrovat do AI, s tím že si to dohledá dokumenty podle jejich aktuální verze, a dá vám to třeba přesnou ukázku zákonu ze zákoníku, kde to nebude “kecat” a vymýšlet si.