Sabato 19 luglio 2025, ore 2:23

Magazine

Via Po Economia

DeepSeek ha lavorato su due fronti: migliorare l’efficienza del training del LLM di base con una serie di accorgimenti per utilizzare al meglio le GPU; interventi nella la fase di raffinamento del modello per adattarlo a rispondere a domande seguendo un filo di ragionamento (CoT) e a imparare a scegliere la risposta preferibile tra varie possibili. La tecnica adottata per questa fase consente di eliminare l’intervento di annotatori umani e usa un altro loro modello per fornire i suggerimenti sui ragionamenti da seguire. Il risultato finale, DeepSeek V3, è un modello piuttosto grande, da 671 miliardi di parametri, che è in grado di rivaleggiare con modelli ancor più grandi e costosi da produrre. Ma il modello più grande può essere “distillato” in modelli più piccoli, di nicchia o specializzati, aumentando significativamente le loro capacità di ragionamento senza aumentarne le dimensioni. Questo non significa che non sia ancora utile sviluppare i modelli di base più potenti al fine di avanzare i loro limiti. E nemmeno che DeepSeek non abbia bisogno di notevoli risorse di calcolo: dispone di circa 50.000 GPU, oltre il triplo di Leonardo del Cineca. Il CoT stimola il modello ad effettuare una serie di passi di ragionamento intermedi nel cercare una soluzione e DeepSeek li esplicita nel rispondere, inseriti tra due tag <think> e </think>, diversamente da OpenAI o1 che invece tiene nascosti i suoi passaggi.

( 15 aprile 2025 )

Magazine

Via Po Cultura

SOLO PER GLI ABBONATI

Lo stimolo etico deve essere un salto verso una concezione dell’interezza dell’umano come soggetto della storia e della politica

  • Email Icon
  • Facebook Icon
  • Twitter Icon
  • Pinterest Icon
Commenta Icona

Libri

Un dramma familiare

A parte i gialli con il commissario Maigret Simenon ha scritto numerosi romanzi chiamati “duri” o “psicologici”, con cui ha saputo andare a fondo dell’animo umano

  • Email Icon
  • Facebook Icon
  • Twitter Icon
  • Pinterest Icon
Commenta Icona

Arte

La balena di Allegrucci e la fragilità del mondo

 Non basterà un rogo a cancellare il suo significato 

  • Email Icon
  • Facebook Icon
  • Twitter Icon
  • Pinterest Icon
Commenta Icona

FOTO GALLERY

Immagine Foto Gallery

© 2001 - 2025 Conquiste del Lavoro - Tutti i diritti riservati - Via Po, 22 - 00198 Roma - C.F. 05558260583 - P.IVA 01413871003

E-mail: conquiste@cqdl.it - E-mail PEC: conquistedellavorosrl@postecert.it