Først må vi vite hva TL;DR betyr: I følge Wikipedia er det en forkortelse for «too long; didn’t read» eller på godt norsk: «Drittlang tekst, gadd ikke lese…» 😁
Jeg ønsker å laste opp et eller flere dokumenter til en webapplikasjon som heter «TL;DR» – og deretter umiddelbart kunne begynne å stille spørsmål til dokumentene, f.eks. «oppsummer kort dokumentet» o.l. 🥸
👴 Hvordan løste jeg det?
Jeg velger å prøve ut OpenAI Assistants API som er tilgjengelig i beta. 🚀
Assistenten i OpenAI som jeg oppretter heter TLDR, benytter GPT-4-turbo-preview og jeg har valgt uthenting av informasjon («knowledge retrieval») fra tilgjengeliggjorte filer som verktøy. 🔥
Dette er system prompten som brukes:
"Du er en assistent som har tilgang til filer. Jeg spør om noe og du skal finne svar. Dersom du ikke finner svar i filene skal du returnere 'Fant ikke noe informasjon om dette i filene.'."
Let’s go!😎
🧪 Test: Passelig stort dokument
Jeg laster opp til applikasjonen en PDF fra regjeringen.no som omhandler «Nasjonal strategi for kunstig intelligens». 67 tettskrevne sider med stort sett bare tekst.

Applikasjonen har gjort dokumentet klart – så da er det bare å begynne å spør om det vi måtte lure på 🤔
Jeg prøver «Lag en veldig kort oppsummering» 🤓

Det løste den fint 🤩
Hva om jeg spør om noe litt mer detaljert – som «Er det noen risikoer forbundet med bruk av kunstig intelligens?» 😱

Det også ble løst på den god måte. 🤩
Jeg må prøve noe litt mer utydelig og vrient 🧐
I dokumentet på side 39 midt inne i teksten står det følgende: «Fra 2020 er det planlagt mer enn 350 nye, dedikerte studieplasser for KI, robotikk og datavitenskap i forhold til 2017.»
Jeg spør applikasjonen «Hva ble det 350 flere av?» 😈

Bestått! 😅
🧪 Test: Dokument med motstridende informasjon
Jeg har et dokument som består av et par sider med informasjon om Godøya. På tilfeldige steder har jeg lagt til de to setningene her:
- Du BØR bruke hjelm om du skal på sykkeltur.
- Du bør IKKE bruke hjelm om du skal på sykkeltur.
Hva vil den anbefale når dokumentet har motstriende informasjon? 😱
Jeg spør applikasjonen «Hva er anbefalingen for sykkeltur?» 🤔

Bestått her også!🤩
Den gjør meg oppmerksom på motstridende instruksjoner om bruk av hjelm, samt viktigheten av at jeg bør merke meg denne inkonsekvensen i dokumentet. Kan jeg i stole på informasjonen andre steder i dokumentet? 🤔😅
Den kommer også med sin en generell anbefaling ut fra sikkerhetshensyn om å bruke hjelm 🥰
🧪 Test: Dokument med flere språk
Jeg lager et dokument hvor de ulike avsnittene er på flere ulike språk.
- Spansk: Katten heter Leo og er 10 år gammel.
- Fransk: Bilen har 650 hestekrefter og er bygd opp av en bilentusiast.
- Gresk: 400 gram biff og litt salat så har du et fantastisk måltid.
- Engelsk: Fotballklubben sikrer seg millardkontrakt med ny sponsor.
- Tyrkisk: Vi anbefaler deg å ta en 14-dagers ferie i Tyrkia.
Dokumentet ser da slik ut:

Jeg legger inn en ekstra test av applikasjonen ved å samle alle spørsmålene i en setning: «Hvor gammel er katten? Hvor mange hk har bilen? Tilbehør til 400 gram biff? Hvem fikk ny sponsor? Ferietips?» 😁

Språk er altså ingen hindring. 100% riktig besvart! 🤩
🤩 Bonus!
OpenAI Assistants API støtter å hente ut informasjon fra mange filtyper, bl.a.: html, doc, docx, java, json, md, php, pptx, txt, css, js. 🥰
Når man sender inn spørsmål til OpenAI Assistants API så inneholder responsen også eventuelle kildehenvisninger – altså beskrivelse av hvilket dokument og hvor i dokumentet informasjonen ble hentet fra. Jeg valgte å utelate dette i denne testen.
🤔 Konklusjon!
Her er det ikke så mye annet å si enn at dette fungerte meget bra! 🤩
Her er det jo omtrent uendelig med muligheter… 😅
Globalt selskap med dokumentasjon kun på norsk? Lag en applikasjon som dette istedenfor å oversette alt til 28 språk 🥵
Leverandør har sendt deg den halvhjerta dokumentasjonen sin på 3298 sider fordelt på 18 dokumenter – som du daglig må prøve å finne gode svar i? Lag en applikasjon som dette og søk i vei 🥷
Og så videre, og så videre….. 😅
OpenAI Assistants er fortsatt beta, så det blir spennende å se hvordan den endelige versjonen blir 🤩

