Organisationen bakom Chat GPT, Open AI, säger att de vill samarbete med tredjepartsorganisationer för att ta fram nya och bättre dataset för att träna AI genom Open AI Data Partnerships.
Open AI skriver att de är intresserade av storskaliga dataset som reflekterar det mänskliga samhället och i dagsläget inte är lättillgängliga online för allmänheten. Dataseten kan innehålla text, bilder, ljud eller video.
"Vi letar specifikt efter data som uttrycker mänsklig intention (till exempel längre texter eller konversationer snararer en korta fragment) i många olika språk, ämnen och format", skriver Open AI. Företaget säger att de också kan hjälpa organisationer med att digitalisera data och ta bort personlig information från den.
De dataset som existerar idag anses ofta ha stora brister. Bland annat kritiseras de för att vara partiska, eftersom de bygger på data från samhället som i sig självt ofta är partiskt. Detta riskerar också att göra AI-modeller partiska eftersom de tränats upp på dataseten.
Läs också: Open AI laddar om – nu kommer GPT-4 Turbo