-3 C
București
luni, 20 ianuarie 2025
AcasăȘtirile zileiUn milion de cărți din domeniul public disponibile pentru AI, cu ajutorul...

Un milion de cărți din domeniul public disponibile pentru AI, cu ajutorul Harvard și Google

Harvard University, în colaborare cu Google, se pregătește să lanseze un set de date format din aproximativ 1 milion de cărți din domeniul public, care vor fi utilizate pentru antrenarea inteligenței artificiale.

Colaborarea între Google și Harvard

Această inițiativă va include opere din diverse genuri, limbi și autori celebri, precum Charles Dickens, Dante Alighieri și William Shakespeare, ale căror lucrări nu mai sunt protejate de drepturi de autor din cauza vechimii lor, scrie techcrunch.

Proiectul face parte din Inițiativa pentru Date Instituționale (Institutional Data Initiative – IDI) a Harvard, care a fost anunțată inițial în martie. Scopul acestei inițiative este de a crea un mediu de încredere pentru accesarea legală a datelor utilizabile în dezvoltarea inteligenței artificiale.

Setul de date va oferi cercetătorilor și startup-urilor acces la resurse extinse pentru antrenarea modelelor de limbaj mare (LLMs), reducând astfel barierele de intrare în acest domeniu costisitor și, până acum, dominat de marile companii de tehnologie.

Greg Leppert, directorul executiv al IDI, a subliniat că scopul este de a „egaliza șansele”, permițând oricui, de la laboratoare de cercetare până la startup-uri, să beneficieze de acest „tezaur de informații”.

Acest set de date va fi derivat din proiectul Google Books, inițiativa de scanare a cărților lansată de Google cu ani în urmă. Google va avea un rol central în distribuirea acestei colecții extinse de resurse literare. Totodată, proiectul IDI beneficiază de sprijin financiar din partea Microsoft și OpenAI, ceea ce subliniază importanța strategică a proiectului în ecosistemul AI global.

Momentul exact al lansării și detaliile privind accesarea dataset-ului nu au fost încă dezvăluite, dar anunțul a atras atenția comunității academice și tehnologice.

Disponibilitatea gratuită a unui volum atât de mare de date reprezintă o oportunitate semnificativă pentru inovare în AI, democratizând accesul la resurse esențiale pentru dezvoltarea modelelor avansate.

Urmărește România Liberă pe XFacebook și Google News!

Alexandru Stancu
Alexandru Stancu
2017 este anul debutului meu în presă. Am trecut pe la ProTv și Aleph News, iar din vara lui 2021 am devenit editor web la România Liberă.
Cele mai citite
Ultima oră
Pe aceeași temă