AI mun breyta því hvernig við gerum efnafræði: GPT-3 prófið

EPFL vísindamenn hafa betrumbætt kynslóða gervigreind og komist að því að það virkar betur en líkön sem eru sérstaklega þjálfaðar fyrir vísindi

GPT-3 gæti gjörbylt efnafræði
EPFL vísindamenn hreinsuðu GPT-3 og komust að því að það virkar jafnvel betur en gerðir sem eru sérstaklega þjálfaðar fyrir efnarannsóknir (Mynd: EPFL/iStock)

L 'Artificial Intelligence það er að verða grundvallartæki í rannsóknum efnafræði: hægt er að fela sérþjálfuðum mállíkönum hönnun sameinda eða spá um eiginleika þeirra, og vél nám það hefur þegar fundið sinn stað í efnarannsóknastofum.

Það sem rannsakendur komust að Alríkisfjöltækniskólinn í Lausanne, hefur hins vegar möguleika á að gjörbylta efnarannsóknum: GPT-3, þetta var fyrsti titill rannsóknarinnar sem nýlega var birt á „Nature Machine Intelligence“, það gæti verið „allt sem þú þarft fyrir efnarannsóknir úr takmörkuðum gagnasöfnum".

Jafnvel þó ég þekki ekki flesta efnafræðirit, útgáfan af GPT-3 fullkomnuð af teyminu kl Berend Smith hefur sannað að það getur keppt við hefðbundna og dýra tækni sjálfvirkt nám, brautryðjandi algjörlega nýrrar nálgunar í efnafræði sem gæti breytt því hvernig rannsóknir eru gerðar að eilífu.

Generative AI: „Þetta eru störfin sem verða ekki lengur til þökk sé mér“
Hinn heilagi gral græns efnafræði: eiturefnalaus flúorefna
GPT-3, reikniritið sem skrifar eins og maður kemur til Ítalíu

Efnafræði: GPT-3 getur breytt því hvernig við gerum rannsóknir
Grunn gervigreind líkön eins og GPT-3 gætu breytt því hvernig efnarannsóknir eru gerðar að eilífu: EPFL rannsókn (Mynd: Envato)

Efnafræði í orðum: GPT-3 AI prófið

L 'Artificial Intelligence hefur farið inn í efnarannsóknir um nokkurt skeið: thesjálfvirkt námhefur sérstaklega verið metið í gegnum árin fyrir hæfni sína til að taka ákvarðanir byggðar á gögnum og gera mjög nákvæmar spár sem hægt er að nota einnig til að búa til ný lyf.

Vélnám krefst hins vegar mikið magn af gögnum að gera áreiðanlegar spár, sem er ekki svo augljóst í efnafræði: oft eru tiltæk gögn ekki nægjanleg til að reikniritin geti æft sig, þannig að virkni "merkts" eða eftirlits vélanáms er háð alvarlegar takmarkanir.

Svona sumir vísindamennEPFL þeim datt í hug prófa möguleika GPT-3, við undirstöðu hinnar frægu ChatGPT forrit: "Sú staðreynd að grunnlíkön gætu framkvæmt verkefni sem þau voru ekki sérstaklega þjálfuð í“, lesum við í rannsókninni sem nýlega var birt á 'Nature Machine Intelligence', "leiddi okkur til að velta því fyrir okkur hvort þeir væru líka færir um að svara vísindalegum spurningum sem við höfum ekki svar við".

Þar sem í efnarannsóknum geta flest vandamálin verið tjáð í orðum, rannsakendur hugsuðu um að þjálfa þessi risastóru líkön til að svara sumum „efnafræðingar“ spurningar sem er ómögulegt að leysa án þess að grípa til flókins uppgerð og tilraunir (til dæmis: „Ef ég skipti um málminn í málmlífrænu umgjörðinni minni, verður hann þá stöðugur í vatni?").

Gervigreind og heilmyndir: nýju landamæri heilsugæslunnar
„Holotransport“ sem er samþætt gervigreind er frumraun
SwissGPT: Svissneska gervigreindin sem gjörbyltir öryggi fyrirtækja

GPT-3 gæti einfaldað efnarannsóknir
Að geta yfirheyrt líkan eins og GPT-3 þýðir að geta nýtt miklu betur þá þekkingu sem vísindamenn hafa safnað í gegnum árin (Mynd: Envato)

Efnafræði: endurbætt GPT-3 fyrir ómöguleg svör

Öfugt við það sem upphaflega efasemdir gætu gefið til kynna, spyr aðferðin sem þróuð var af EPFL vísindamönnum ekki beint spurninga um GPT-3 efnafræði. “GPT-3 þekkir ekki flestar efnafræðilegar ritgerðir, þannig að ef við spyrjum ChatGPT efnafræðilegrar spurningar eru svörin almennt takmörkuð við það sem er að finna á Wikipedia“, Útskýrir hann Kevin Maik Jablonka, aðalhöfundur rannsóknarinnar.

"Í staðinn", útskýrir Jablonka, "við fínstillt GPT-3 með litlu gagnasafni breytt í spurningar og svör og við fengum nýtt líkan sem getur veitt mjög nákvæmar efnaupplýsingar".

Við svokallaða fínstillingu gáfu rannsakendur GPT-3 lista yfir Spurningar og svör: "Til dæmis, fyrir málmblöndur með mikla óreiðu, er mikilvægt að vita hvort málmblöndur á sér stað í einum fasa eða hefur marga fasa", Útskýrir hann Berend Smith, prófessor í efnaverkfræði við grunnvísindadeild EPFL.

Smit útskýrir slíkt vandamál er þýtt yfir í lista yfir spurningar og svör eins og „D = 'The Er það einfasa?' R= 'Já/Nei'“.

"Í bókmenntum fundum við nokkrar málmblöndur sem svarið er þekkt fyrir og við notuðum þessi gögn til að þróa GPT-3“, heldur Smit áfram, “það sem við enduðum með er fágað gervigreind líkan sem er þjálfað til að svara þessari spurningu eingöngu já eða nei".

Gervigreind einnig fyrir þróun nýrra lyfja
Þróun nýrra lyfja, bókasöfn aukin þökk sé efnafræði
Í átt að stafrænum húmanisma: greining á byltingu með endurlausn

GPT-3 getur sérhæft sig og gjörbylt efnafræði
Rannsókn á vegum Federal Polytechnic í Lausanne skoðar mismunandi verkefni: allt frá flokkun (miðað við textamynd sameindar, efnis eða hvarfs) til aðhvarfs (Mynd: Jablonka, KM, Schwaller, P., Ortega-Guerrero, A. et al. Nýting stórra tungumálalíkana fyrir forspárefnafræði, Nat Mach Intell, 2024)

Grunnlíkön eins og GPT-3 í rútínu vísindamanna

„Enhanced“ líkanið, þjálfað með tiltölulega fáum spurningum og svörum, leysti rétt meira en 95 prósent málaflokkanna á mjög mismunandi efnafræðilegum vandamálum, oft betri en vélanámslíkön sem eru sérstaklega forrituð fyrir það verkefni.

"Málið er að það er eins auðvelt og að gera bókmenntaleit“, útskýrir Smit, “sem vinnur þó með mörgum efnafræðilegum vandamálum“. Ennfremur er nálgunin sem Kevin Maik Jablonka þróaði óvenju hratt og krefst ekki sérstakrar færni, ólíkt hefðbundnum módelum vél nám.

Afleiðingar þessarar rannsóknar gætu verið afgerandi: möguleikinn á að móta spurningar eins og „Hver er afrakstur [efna] sem er búið til með þessari [uppskrift]?” og fá a nákvæmt svar gæti gjörbylt því hvernig efnarannsóknir er skipulagt og stjórnað.

Eins og rannsóknin segir, "að geta yfirheyrt grunnlíkan eins og GPT-3 gæti orðið venjubundin aðferð til að hefja rannsóknarverkefni sem nýtir sameiginlega þekkingu sem er kóðuð í þessum grundvallarlíkönum eða til að veita grunnlínu fyrir forspáraðgerðire ”.

"Það mun breyta því hvernig við gerum efnafræði“, segir prófessor Smit umbúðalaust.

Vatn, gras og mannkyn: vitsmunaleg mörk gervigreindar
Gervigreind mun hjálpa okkur að hreinsa höfin af plasti
Stóra 100 efnafræðinnar og áskoranir heimshagkerfisins

Efnarannsóknir með GPT-3: rannsóknin
Í framtíðinni gætum við kannski spurt gervigreind hver afrakstur tiltekinnar efnavöru sé með því að nota ákveðna uppskrift og það verður eins einfalt og að gera bókmenntaleit (Mynd: Envato)

GPT-3 er „bara“ tæki: rannsóknir halda áfram

Niðurstöður rannsóknarinnar vekja upp spurningu sem ekki er aukaatriði: hvernig er mögulegt að a náttúrulegt málmódel, án sérstakrar þjálfunar í efnafræði, kann að vera nákvæmari en sérforritaðar gerðir?

"Byggt á þekkingu okkar“, lesum við í blaðinu, “Það er ekkert strangt svar við þessari spurningu".

Sú staðreynd að mjög vænlegar niðurstöður fást jafnvel með því að nota algjörlega ímyndaðar efnaframsetningar sýnir að þessi grunnlíkön eru "mjög hentugur til að draga fylgni úr hvaða texta sem er“.

Ma leitin er nýhafin. Eins og vísindamennirnir útskýra, þá er sú staðreynd að GPT-3 auðkennir fylgni sem hægt er að nýta með góðum árangri til að gera spár um þýðir ekki að fylgni sé alltaf marktæk eða tengt orsök-afleiðingu samböndum.

Í augnablikinu álykta vísindamennirnir, GPT-3 "þetta er bara tæki sem gerir okkur kleift að nýta á skilvirkari hátt þá þekkingu sem vísindamenn hafa safnað í gegnum árin".

Og aftur: "Næsta skref verður að nota GPT-3 til að bera kennsl á þessar fylgnir og að lokum öðlast dýpri skilning".

Hér er hvernig gervigreind er að gjörbylta kauphegðun
Þróun leitarvéla: áhrif gervigreindar, hlutverk Google
Svona hafa gervigreind kerfi falin siðferðileg gildi ...

"Hvað þýðir það að vera tölva: GPT-3 viðtal" (á ensku)

"Hvað þýðir það að vera tölva: GPT-3 viðtal" (á ensku)
GPT-3 í efnarannsóknum: næstu rannsóknarskref
Sú staðreynd að GPT-3 greinir fylgni sem hægt er að nýta með góðum árangri til að gera spár fyrir þýðir ekki að fylgnin sé alltaf marktæk eða tengd orsök og afleiðingu samböndum: rannsóknin er rétt að byrja (Mynd: Envato)