Bijblijven in een branche die zo snel evolueert als AI is een hele opgave. Dus totdat een AI het voor je kan doen, is hier een handige samenvatting van de verhalen van de afgelopen week in de wereld van machine learning, samen met opmerkelijk onderzoek en experimenten die we niet alleen hebben behandeld.
Deze week kondigde Amazon in AI aan dat het generatieve AI gaat gebruiken om productrecensies te “verbeteren”. Zodra de functie is uitgerold, biedt de functie een korte alinea met tekst op de productdetailpagina die de productmogelijkheden en het klantsentiment belicht die in de beoordelingen worden genoemd.
Klinkt als een handige functie, niet? Misschien voor shoppers en verkopers. Maar hoe zit het met recensenten?
Ik ga niet beweren dat Amazon-recensies een vorm van hoge kunst zijn. Integendeel, een behoorlijk aantal op het platform is niet echt – of wordt zelf door AI gegenereerd.
Maar sommige recensenten, of ze nu oprecht bezorgd zijn om hun medeshopper of een poging om de creatieve sappen te laten stromen, steken tijd in het maken van recensies die niet alleen informeren, maar ook entertainen. Samenvattingen van deze beoordelingen zouden hen onrecht aandoen – en het punt volledig missen.
Misschien ben je deze edelstenen tegengekomen. Vaak zijn ze te vinden in de beoordelingssecties voor boeken en films, waar, in mijn anekdotische ervaring, Amazon-recensenten de neiging hebben om meer… breedsprakig te zijn.

Beeldcredits: Amazone
Neem Amazon-gebruiker “Sweet Home’s” recensie van JD Salinger’s “Catcher in the Rye”, die meer dan 2000 woorden telt. Verwijzend naar het werk van William S. Burroughs en Jack Kerouac, maar ook naar George Bernard Shaw, Gary Snyder en Dorothy Parker, is de recensie van Sweet Home niet zozeer een recensie als wel een grondige analyse, waarbij de rode draad van de roman wordt opgepikt en in een context wordt geplaatst in een poging om uit te leggen hoe het blijft. stroom.
En dan is er Bryan Desmonds recensie van ‘Gravity’s Rainbow’, de beruchte dichte roman van Thomas Pynchon. Evenzo langdradig – 1.120 woorden – onderstreept het niet alleen de hoogtepunten (oogverblindend proza) en dieptepunten (verouderde houdingen, vooral ten opzichte van vrouwen) van het boek, zoals men zou verwachten van een recensie, maar geeft het in groot detail weer Desmonds ervaring met het lezen ervan.
Kan AI die samenvatten? Zeker. Maar ten koste van nuance en inzicht.
Amazon is natuurlijk niet van plan beoordelingen aan het zicht te onttrekken ten gunste van door AI gegenereerde samenvattingen. Maar ik vrees dat recensenten minder geneigd zullen zijn om bijna evenveel tijd en aandacht te besteden als hun werk steeds ongelezen wordt door de gemiddelde shopper. Het is een groots experiment, en ik veronderstel dat – zoals met de meeste dingen die generatieve AI aanraakt – alleen de tijd het zal leren.
Hier zijn enkele andere AI-verhalen van de afgelopen dagen:
- Mijn AI gaat schurkenstaten: Snapchat’s My AI-functie, een in-app AI-chatbot die eerder dit jaar werd gelanceerd met een behoorlijk deel van de controverse, leek even een eigen mening te hebben. Dinsdag plaatste de AI zijn eigen verhaal in de app en reageerde vervolgens niet meer op berichten van gebruikers, wat sommige Snapchat-gebruikers verontrustend vonden. Snapchat-moederbedrijf Snap bevestigde later dat het om een bug ging.
- OpenAI stelt nieuwe moderatietechniek voor: OpenAI beweert dat het een manier heeft ontwikkeld om GPT-4, zijn vlaggenschip generatieve AI-model, te gebruiken voor inhoudsmoderatie – waardoor de last voor menselijke teams wordt verlicht.
- OpenAI neemt een bedrijf over: In meer OpenAI-nieuws heeft de AI-startup Global Illumination overgenomen, een in New York gevestigde startup die AI gebruikt om creatieve tools, infrastructuur en digitale ervaringen te bouwen. Het is de eerste openbare overname van OpenAI in zijn ongeveer zevenjarige geschiedenis.
- Een nieuwe dataset voor LLM-trainingen: Het Allen Institute for AI heeft een enorme tekstdataset vrijgegeven voor grote taalmodellen (LLM’s) in de trant van OpenAI’s ChatGPT die gratis kan worden gebruikt voor inspectie. Dolma, zoals de dataset heet, is bedoeld als basis voor het geplande open taalmodel van de onderzoeksgroep, of OLMo (Dolma is een afkorting van “Data om OLMo’s Appetite te voeden).
- Vaatwas-, deuropeningsrobots: Onderzoekers van ETH Zürich hebben een methode ontwikkeld om robots te leren taken uit te voeren zoals het openen en door deuren lopen – en meer. Het team zegt dat het systeem kan worden aangepast voor verschillende vormfactoren, maar omwille van de eenvoud hebben ze demo’s uitgevoerd op een viervoeter – die hier kan worden bekeken.
- Opera krijgt een AI-assistent: Opera’s webbrowser-app voor iOS krijgt een AI-assistent. Het bedrijf kondigde aan deze week zal Opera op iOS nu Aria bevatten, zijn browser AI-product gebouwd in samenwerking met OpenAI, direct geïntegreerd in de webbrowser en gratis voor alle gebruikers.
- Google omarmt AI-samenvattingen: Google heeft deze week een paar nieuwe updates uitgerold voor zijn bijna drie maanden oude Search Generative Experience (SGE), de AI-aangedreven conversatiemodus van het bedrijf in Zoeken, met als doel gebruikers te helpen de informatie die ze op internet ontdekken beter te leren en te begrijpen. De functies omvatten tools om definities van onbekende termen te zien, die helpen om uw begrip en coderingsinformatie in verschillende talen te verbeteren en een interessante functie waarmee u tijdens het browsen kunt profiteren van de AI-kracht van SGE.
- Google Foto’s krijgt AI: Google Foto’s heeft een toegevoegd nieuwe manier om uw meest memorabele momenten opnieuw te beleven en te delen met de introductie van een nieuwe Herinneringen-weergave, waarmee u uw favoriete herinneringen kunt opslaan of uw eigen herinneringen kunt creëren. Met Herinneringen kun je een plakboekachtige tijdlijn samenstellen met zaken als je meest memorabele reizen, feesten en dagelijkse momenten met dierbaren.
- Anthropic haalt meer geld op: Antropischeen AI-startup mede opgericht door voormalige OpenAI-leiders, ontvangt $ 100 miljoen aan financiering van een van de grootste mobiele providers in Zuid-Korea, SK Telecom, maakte het telecombedrijf zondag bekend. Het financieringsnieuws komt drie maanden nadat Anthropic $ 450 miljoen ophaalde in zijn Series C-financieringsronde onder leiding van Spark Capital in mei.
Meer machine learning
Ik (dat wil zeggen, uw co-auteur Devin) was vorige week bij SIGGRAPH, waar AI, ondanks dat het op dit moment een boeman is in de film- en tv-industrie, volledig van kracht was als zowel een hulpmiddel als een onderzoeksonderwerp. Ik zal binnenkort een langer verhaal vertellen over hoe het binnenkort door VFX-artiesten op innovatieve en totaal oncontroversiële manieren wordt gebruikt, maar de tentoongestelde papieren waren ook behoorlijk goed. Vooral deze sessie leverde een aantal interessante nieuwe ideeën op.

Beeldcredits: Universiteit van Tel Aviv
Beeldgenererende modellen hebben iets raars: als je ze vertelt om “een witte kat en een zwarte hond” te tekenen, worden de twee vaak door elkaar gehaald, wordt er een genegeerd of wordt er een kathond of dieren gemaakt die zowel zwart als wit zijn. Een aanpak van de Universiteit van Tel Aviv genaamd “attend and excite” sorteert de prompt in zijn samenstellende delen door middel van aandacht, en zorgt er vervolgens voor dat het resulterende beeld de juiste representaties van elk bevat. Het resultaat is een model dat veel beter is in het ontleden van prompts met meerdere onderwerpen. Ik zou verwachten dat zoiets binnenkort in kunstgeneratoren wordt geïntegreerd!

Beeldcredits: MIT/Max Planck Instituut
Een andere zwakte van generatieve kunstmodellen is dat als je kleine veranderingen wilt aanbrengen, zoals het onderwerp dat wat meer opzij kijkt, je het hele ding opnieuw moet doen – waarbij je soms verliest wat je leuk vond aan het beeld om mee te beginnen. “Drag Your GAN” is een behoorlijk verbazingwekkende tool waarmee de gebruiker punten één voor één of meerdere tegelijk kan instellen en verplaatsen – zoals je kunt zien in de afbeelding, kan de kop van een leeuw worden gedraaid of de bek kan worden geopend door gewoon te regenereren. dat deel van het beeld dat overeenstemt met de nieuwe verhoudingen. Google staat in de auteurslijst, dus je kunt er zeker van zijn dat ze kijken hoe dit te gebruiken.

Beeldcredits: Universiteit van Tel Aviv
Dit papier met “semantische typografie” is leuker, maar ook buitengewoon slim. Door elke letter als een vectorafbeelding te behandelen en die afbeelding naar een vectorafbeelding van het object te duwen waarnaar een woord verwijst, creëert het behoorlijk indrukwekkende logo’s. Als u niet weet hoe u uw bedrijfsnaam in een visuele woordspeling kunt veranderen, kan dit een goede manier zijn om aan de slag te gaan.
Elders hebben we een interessante kruisbestuiving tussen hersenwetenschap en AI.

Nou, zo simpel is het niet.
Deze Berkeley-onderzoekers gebruikten een machine learning-model om hersenactiviteit te interpreteren terwijl ze naar muziek luisterden, en reconstrueerden enkele van de clusters die gericht waren op ritme, melodie of zang. Ik sta altijd sceptisch tegenover dit soort onderzoeken van het type ‘we lezen de hersenen’, dus neem het allemaal met een korreltje zout, maar ML is geweldig in het isoleren van een signaal in ruis, en hersenactiviteit is zeer, zeer luidruchtig.
MIT en Harvard werkten samen om ons begrip van astrocyten, cellen in de hersenen die een tot nu toe onbekende functie vervullen, te vergroten. Ze stellen voor dat de cellen kunnen fungeren als zoiets als een transformator of aandachtsmechanisme – een machine learning-concept dat op de hersenen wordt afgebeeld in plaats van andersom! Senior paper-auteur Dmitry Krotov van MIT vat het goed samen:
De hersenen zijn veel beter dan zelfs de beste kunstmatige neurale netwerken die we hebben ontwikkeld, maar we weten niet precies hoe de hersenen werken. Het is wetenschappelijk waardevol om na te denken over verbindingen tussen biologische hardware en grootschalige kunstmatige-intelligentienetwerken. Dit is neurowetenschap voor AI en AI voor neurowetenschap.
Bij medische AI worden gegevens van consumentenapparaten ook vaak als luidruchtig of onbetrouwbaar beschouwd. Maar nogmaals, ML-systemen kunnen zich aanpassen, zoals dit nieuwe artikel van Yale laat zien. Het onderzoek zou ons dichter bij wearables moeten brengen die ons waarschuwen voor hartgerelateerde problemen voordat ze acuut worden.

Leerlingen demonstreren hun lege stoelzoek-app.
Een van de eerste praktische toepassingen van GPT-4 was het gebruik in Be My Eyes, een app die blinde mensen helpt navigeren met behulp van een externe partner. EPFL-studenten ontwikkelden nog twee apps die best leuk kunnen zijn voor iedereen met een visuele beperking. De ene leidt de gebruiker simpelweg naar een lege stoel in een kamer, en de andere leest alleen de relevante informatie uit medicijnflesjes: het actieve ingrediënt, de dosering, enz. Zulke eenvoudige maar noodzakelijke taken!
Ten slotte hebben we het peuter-equivalent “RoboAgent”, ontwikkeld door CMU en Meta, dat tot doel heeft alledaagse vaardigheden te leren, zoals dingen oppakken of objectinteracties begrijpen door gewoon naar dingen te kijken en ze aan te raken – zoals een kind dat doet.
“Een agent die in staat is tot dit soort leren, brengt ons dichter bij een algemene robot die een verscheidenheid aan taken kan uitvoeren in verschillende ongeziene omgevingen en voortdurend evolueert naarmate hij meer ervaringen opdoet”, zegt Shubham Tulsiani van CMU. Hieronder kunt u meer te weten komen over het project:
Source link: https://techcrunch.com/2023/08/19/this-week-in-ai-amazon-enhances-reviews-with-ai-while-snaps-goes-rogue/