Efter att ha avslöjats första dagen chockade GPT-4 många användare i tidiga tester och en företagsdemo med sin förmåga att skriva rättegångar, klara standardiserade prov och bygga en fungerande webbplats från en handritad skiss.
Den kraftfullare GPT-4 lovar att slå tidigare iterationer ur spel och potentiellt förändra sättet vi använder internet för att arbeta, spela och skapa. Men det kan också lägga till utmanande frågor om hur AI-verktyg kan välta yrken, möjliggöra fusk för studenter och förändra vår relation till teknik.
Innehåll
GPT-4 är en uppdaterad version av företagets stora språkmodell, som är tränad på stora mängder online-data för att generera komplexa svar på användarfrågor. Den finns nu tillgänglig via en väntelista och har redan integrerats i vissa tredjepartsprodukter, inklusive Microsofts nya AI-drivna sökmotor Bing. Vissa användare med tidig tillgång till verktyget delar med sig av sina erfarenheter och belyser några av dess mest övertygande användningsfall.
Här är en närmare titt på potentialen i GPT-4:
Analysera mer än text
I sin kärna är den största förändringen med GPT-4 dess förmåga att arbeta med foton som användare laddar upp.
Ett av de mest imponerande användningsfallen hittills kom från en OpenAI-videodemo som visade hur en ritning kunde förvandlas till en fungerande webbplats på några minuter. Demonstratören laddade upp bilden i GPT-4 och klistrade sedan in den resulterande koden i en förhandsgranskning som visade hur det kunde bli en fungerande webbplats.
I sitt meddelande visade OpenAI också hur GPT-4 fick förklara en skämt från en serie bilder – som visade en smartphone med fel laddare – och beskrev varför det var roligt. Även om det kan låta enkelt är det mer komplicerat för artificiell intelligens att plocka upp på grund av behovet av sammanhang.
I ett annat test visade The New York Times GPT-4 en bild på insidan av ett kylskåp och bad den att komma med en måltid baserat på ingredienserna.
Funktionen med foton är ännu inte live, men OpenAI förväntas rulla ut den under de kommande veckorna.
Bättre kodning
Några av de tidiga GPT-4-användarna med mycket lite eller ingen tidigare kodningskunskap har också använt det för återskapandet av ikoniska spel som Pong, Tetris eller Snake efter steg-för-steg-instruktioner som tillhandahålls av verktyget har varit möjligt för vissa användare. Andra har skapat sina egna originella spel. (GPT-4 kan skriva kod på alla stora programmeringsspråk, enligt OpenAI.)
“De kraftfulla språkförmågorna hos GPT-4 kommer att användas för allt från storyboards, karaktärsskapande till spelkreativt innehåll”, säger Arun Chandrasekaran, analytiker vid Gartner Research. “Detta kan ge upphov till fler oberoende spelleverantörer i framtiden. Men utöver själva spelet kan GPT-4 och liknande modeller användas för att skapa marknadsföringsinnehåll kring spelvisningar, generera nyhetsartiklar och till och med moderera spelrelaterade diskussionsforum.”
Liksom med spel kan GPT-4 förändra sättet människor utvecklar appar på. En användare på Twitter sa att de gjorde en enkel ritningsapp på några minuter, medan en annan påstod sig ha kodat en app som rekommenderar fem nya filmer varje dag, samt ger trailers och detaljer om var man kan titta på dem.
“Att koda är som att lära sig att köra – så länge nybörjaren får viss vägledning, kan vem som helst koda”, säger Lian Jye Su, analytiker vid ABI Research. “AI kan vara en bra lärare.”
Att klara tester med höga betyg
Även om OpenAI sa att uppdateringen är “mindre kapabel” än människor i många verkliga scenarier, visar den “mänsklig prestanda” på olika professionella och akademiska tester. Företaget sa att GPT-4 nyligen klarade ett simulerat juridiskt barprov med ett resultat runt topp 10% av testtagarna. I jämförelse, GPT-3.5, tidigare versionen, fick ett resultat runt botten 10%. Den senaste versionen presterade också starkt på LSAT, GRE, SAT och många AP-prov, enligt OpenAI.
I januari skapde ChatGPT stora rubriker för sin förmåga att klara prestigefyllda examina på kandidatnivå, som en från University of Pennsylvanias Wharton School of Business, men inte med särskilt höga poäng. Företaget sa att det spenderade månader med att använda lärdomar från sitt testprogram och ChatGPT för att förbättra systemets noggrannhet och förmåga att hålla sig på ämnet.
Ge mer precisa svar Jämfört med tidigare versionen kan GPT-4 producera längre, mer detaljerade och mer pålitliga skriftliga svar, enligt företaget.
Den senaste versionen kan nu ge svar på upp till 25 000 ord, jämfört med cirka 4 000 tidigare, och kan ge detaljerade instruktion för även de mest unika scenarierna, från hur man rengör en pirayas fisktank till att extrahera jordgubbens DNA. En tidig användare sa att den gav djupgående förslag på raggningsrepliker baserat på en fråga som listats på en datingsprofil.
Effektivisera arbetet över olika branscher
Joshua Browder, VD för chattboten för juridiska tjänster, DoNotPay, sa att hans företag redan arbetar med att använda verktyget för att generera “en-klicka-stämningar” för att stämma robocallers, vilket visar den stora potentialen för GPT-4 att förändra hur människor arbetar över olika branscher.
“Tänk dig att ta emot ett samtal, klicka på en knapp, [samtals] är transkriberat och en 1000-ords stämning är genererad. GPT-3.5 var inte tillräckligt bra, men GPT-4 klarar jobbet extremt bra”, twittrade Browder.
Samtidigt sa Jake Kozloski, VD för datingsidan Keeper, att hans företag använder verktyget för att bättre matcha sina användare.
Enligt Su vid ABI Research är det möjligt att vi också kommer att se stora framsteg inom “anslutna bil[dashboardar], fjärrdiagnos inom hälso- och sjukvården och andra AI-applikationer som tidigare inte var möjliga.”
Utveckling pågår
Även om företaget har gjort stora förbättringar på sin AI-modell har GPT-4 liknande begränsningar som tidigare versioner. OpenAI sa att tekniken saknar kunskap om händelser som inträffade före dess datamängd klipps av (september 2021) och lär sig inte av sin erfarenhet. Den kan också göra “enklare resonemangsfel” eller vara “alltför lättrörlig att acceptera uppenbara falska påståenden från en användare” och dubbelkollar inte arbetet, sa företaget.
Chandrasekaran på Gartner sa att detta också återspeglar många AI-modeller idag. “Låt oss inte glömma att dessa AI-modeller inte är perfekta,” sa Chandrasekaran. “De kan producera felaktig information från tid till annan och kan vara svarta lådor i sin natur.”
För tillfället sa OpenAI att GPT-4-användare bör utöva försiktighet och använda “stor omsorg” särskilt “i höga insatskontexter.”
Samarbeten
OpenAI har även samarbetat med kommersiella partners för att erbjuda tjänster som drivs av GPT-4. En ny prenumerationstjänst för språkinlärningsappen Duolingo, Duolingo Max, kommer nu att erbjuda engelsktalande användare AI-drivna konversationer på franska eller spanska och kan använda GPT-4 för att förklara de misstag språkstudenter har begått. I andra änden av spektrumet använder betalningshanteringsföretaget Stripe GPT-4 för att besvara supportfrågor från företagsanvändare och för att hjälpa till att flagga potentiella bedragare i företagets supportforum.
“Artificiell intelligens har alltid varit en stor del av vår strategi”, sade Duolingos huvudproduktchef, Edwin Bodge. “Vi hade använt det för att anpassa lektioner och genomföra Duolingo engelska tester. Men det fanns luckor i en elevs resa som vi ville fylla: konversationsövning och kontextuell feedback på misstag.” Företagets experiment med GPT-4 övertygade dem om att tekniken var kapabel att tillhandahålla dessa funktioner, med “95%” av prototypen skapad inom en dag.
Duolingos samarbete med OpenAI och implementeringen av GPT-4 i Duolingo Max är ett stort steg framåt inom språkinlärning. Detta kommer att ge användarna en mer verklighetstrogen upplevelse när de övar sina språkkunskaper i konversationer. Den AI-drivna tekniken kommer även att göra det möjligt för användarna att få individanpassad feedback på sina misstag, vilket i sin tur kommer att förbättra deras inlärningsprocess och språkförståelse.
För Stripe innebär användningen av GPT-4 en möjlighet att förbättra kundsupporten och effektiviteten i hanteringen av supportärenden. Genom att använda artificiell intelligens för att svara på frågor och upptäcka potentiella bedragare kommer Stripe att kunna fokusera på att erbjuda en säkrare och mer användarvänlig plattform för sina företagskunder.
Dessa exempel visar hur GPT-4 kan revolutionera olika industrier och hur AI-tekniken kan användas för att förbättra användarupplevelsen och effektiviteten inom företag. Samtidigt kommer samarbeten mellan teknikföretag som OpenAI och företag inom olika branscher att fortsätta att driva utvecklingen av artificiell intelligens och bidra till att skapa innovativa lösningar för en rad olika problem och behov.
Men den har sina brister..
Den nya roboten fortsätter att hitta på saker. Problem med hallucination plågar alla ledande chattbotar. Eftersom systemen inte har en förståelse för vad som är sant och vad som inte är det kan de generera text som är helt falsk.
När den tillfrågades om adresserna till webbplatser som beskrev den senaste cancerforskningen, genererade den ibland internetadresser som inte ens existerade. Det här är ett allvarligt problem som kräver omedelbar åtgärd.
I den här artikeln kommer vi att diskutera detta problem mer ingående och utforska några av de saker som kan göras för att lösa det. Vi kommer också att ge några tips om hur du kan använda chattbotar på ett sätt som minskar risken för att de genererar falsk information.
Hallucination i chattbotar
Hallucination är ett problem som drabbar många chattbotar. Det uppstår när boten genererar text som är helt falsk eftersom den inte har någon förståelse för vad som är sant och vad som inte är det. Detta kan leda till allvarliga konsekvenser när boten används för att ge information eller svara på frågor som rör viktiga ämnen, som till exempel medicinsk information eller juridiska råd.
Varför uppstår hallucination?
Hallucination uppstår när chattboten inte har en tillräcklig förståelse för världen runt omkring den. Boten kan ha tillgång till massor av data och text, men utan en förståelse för vad som är sant och vad som inte är det kan den fortfarande generera text som är helt felaktig.
En del av problemet är att botarna ofta tränas på text som är hämtad från internet, vilket kan vara ogenomträngligt för att avgöra vad som är sant och vad som inte är det. Dessutom kan botar tränas på data som innehåller faktafel eller missvisande information, vilket kan förvärra problemet.
Hur kan vi lösa problemet med hallucination?
Det finns flera saker som kan göras för att lösa problemet med hallucination i chattbotar. En av de viktigaste åtgärderna är att ge boten en bättre förståelse för världen runt omkring den. Detta kan uppnås genom att till exempel träna boten på data som innehåller mer nyanserad och komplex information, eller genom att använda tekniker som maskininlärning för att hjälpa boten att förstå skillnaden mellan sant och falskt.
En annan viktig åtgärd är att övervaka botens prestation och kontinuerligt träna och förbättra den. Detta kan hjälpa till att identifiera när boten genererar falsk information och göra det möjligt att korrigera problemet innan det får allvarliga konsekvenser.