
C’è un ridotto intervento umano nell’ addestramento di DeepSeek-R1 , l’innovativo modello di Intelligenza Artificiale liberamente accessibile rilasciato all'inizio di quest'anno. A raccontarne i dettagli sulla rivista Nature sono i ricercatori che l'hanno progettato, guidati da Wenfeng Liang, di DeepSeek-AI.
Le capacità di questo modello di replicare il ragionamento umano , attraverso passaggi intermedi, sono basate sul cosiddetto apprendimento per rinforzo . La tecnica permette cioè di addestrare l’IA affrontando i problemi che incontra risolvendoli passo dopo passo e migliora ogni volta grazie all'ottenimento di una ricompensa quando individua la soluzione corretta . Il tutto avviene in modo automatizzato e senza intervento umano. Un metodo che, in questa fase cruciale, elimina la necessità di intervento umano riducendo così i costi e i tempi di sviluppo .
© RIPRODUZIONE RISERVATA