Stadi: schaner 2026. Survista da las abilitads dals sistems actuals d'IA.
En il center da l'actuala revoluziun da l'IA stattan gronds models da lingua (Large Language Models, LLMs). Il princip: Ina rait neurala cun tschientamilliardas da parameters vegn trenada cun enormas quantitads da text -- cudeschs, paginas d'internet, lavurs scientificas, code. Ella emprenda la structura da la lingua sezza, senza ina finamira specifica [1].

L'architectura decisiva sa numna Transformer, preschentada 2017 en il paper "Attention Is All You Need" da Vaswani e set ulteriurs perscrutaders da Google [2]. Il Transformer considerescha tut ils pleds d'in text simultanamain e calculescha per mintga pled, quant ferm ch'el è collià cun mintga auter (Self-Attention). Quai al renda pli precis e massivamain parallelisabel -- perfect per hardware moderna da GPU.
Il pli surprendent dals gronds models da lingua è ch'els sviluppan abilitads che nagin n'ha programmà explicitamain. A partir d'ina tscherta grondezza dal model cumparescha subitmain novas cumpetenzas -- numnadas abilitads emergentas [3]:
Questas abilitads n'èn betg il resultat d'ina programmaziun misirada. Ellas naschan sco effect lateral da la schira grondezza e quantitad da datas -- in fenomen ch'ha surprais la retschertga da l'IA sezza [3].
Dapi il 2023 elavuran ils models d'IA principals betg mo text, mabain pliras modalitads simultanamain:
| Modalitad | Exempel |
|---|---|
| Text | Essays, contracts, code, poesias |
| Maletgs | Analisar ina foto d'in frichider, proponer ina recetta |
| Audio | Enconuscher la lingua, translaziun simultana |
| Video | Descriver scenas, resumar cuntegns |
GPT-4 è stà il emprim model multimodal larg derasà (mars 2023). Google Gemini ed Anthropic Claude han suandà cun atgnas abilitads multimodalas [4] [5] [6].
Sistems d'IA passan entretant examens ch'èn pretensius per umans:
| Examen | Resultat GPT-4 | Media umana |
|---|---|---|
| Examen d'advocat american (Bar Exam) | Top 10% | 50avel percentil |
| Licenza da medischina (USMLE) | sur 90% en tut 3 parts | Limita da passar tar ~60% |
| Olimpiada da biologia | passà | -- |
| SAT matematica | 700/800 | 528/800 |
GPT-3.5 era tar l'examen d'advocat anc tranter ils 10% ils pli sprovs. GPT-4, be in mez onn pli tard, era tranter ils 10% ils megliers. La rata da megliurament è senza exempel [4].
L'entschatta 2026 identifitgescha l'agent Claude d'Anthropic errurs en code da program complex pli svelt ch'experientsads sviluppaders -- e furnischa la soluziun cun [5]. Betg occasiunalmain, mabain sistematicamain:
Il rol dal programmatur sa displatscha: Betg pli quel che scriva code, mabain quel ch'enclega il problem e controllescha il resultat.
ChatGPT ha cuntanschì suenter sia publicaziun ils 30 da november 2022 ina sveltezza da derasaziun senza exempel [7]:
| Servetsch | Temp fin 1 mio. utilisaders |
|---|---|
| Netflix | 3,5 onns |
| 10 mais | |
| Spotify | 5 mais |
| 2,5 mais | |
| ChatGPT | 5 dis |
Entaifer da dus mais duvrevan 100 milliuns umans ChatGPT. La gronda banca svizra UBS ha numnà quai la derasaziun la pli svelta d'ina applicaziun da consumaders en l'istorgia da l'internet [7].
Malgrà tut ils progress han ils sistems actuals d'IA limitaziuns claras:
La limita tranter quai che l'IA sa e quai che betg sa displatscha dentant pli svelt che mintga prognosa ha previs.
[1] OpenAI: GPT-4 Technical Report. arxiv.org, mars 2023.
[2] Vaswani, Ashish et al.: Attention Is All You Need. NeurIPS, 2017.
[3] Wei, Jason et al.: Emergent Abilities of Large Language Models. Transactions on Machine Learning Research, 2022.
[4] OpenAI: GPT-4 Technical Report. arxiv.org, mars 2023.
[5] Anthropic: Claude 3 Technical Report. anthropic.com, mars 2024.
[6] Google DeepMind: Gemini -- A Family of Highly Capable Multimodal Models. december 2023.
[7] UBS Evidence Lab: ChatGPT -- The Fastest Growing Consumer Application in History. favrer 2023.