Groq AI: chatbot alla velocità della luce

Giulio_M

Negli ultimi mesi (fine febbraio 2024) è nato Groq AI, un nuovo chatbot che ha puntato tutto su una caratteristica, la velocità nelle risposte!
Groq AI logo

Da non confondere con Grok di Elon Musk (xAI), che però non è per nulla decollata (più marketing che altro), accessibile solo tramite account X Premium e dai benchmark a livello medio risulta nettamente inferiore a ChatGPT, Google Gemini, Mistral AI.

Il sito ufficiale di Groq AI è groq.com, si accede con account Google e proprio sul sito ufficiale (wow.groq.com) compare una provocazione ad Elon Musk:

Hey Elon, It’s Time To Cease & De-grok

Considerato che questi modelli di IA di grandi dimensioni, in versione gratuita non sono particolarmente veloci (specialmente ChatGPT, visto il numero di utenti, in passato finiva anche per bloccarsi o non essere accessibile, oggi è comunque piuttosto lento in alcuni momenti), Groq AI ha puntato sulla velocità e lo ha fatto in modo molto particolare. Partendo dal presupposto che le GPU sono più efficienti rispetto alle CPU per questo tipo di compiti (maggior numero di calcoli in parallelo), è stata sviluppata una nuova soluzione hardware, quella delle LPU (Language Process Unit) tramite la creazione di un nuovo chip, Tensor Streaming Processor (TSP). In questo modo un modello come GPT risulta fino a 10 volte più veloce dato che questa architettura hardware è stata ottimizzata ad-hoc per tale compito.

Sul proprio sito, Groq AI ha fin da subito puntato a mettere in mostra i "record di velocità" (Token/s) piuttosto che l'accuratezza, qualità dei risultati nei benchmark. Riguardo alla velocità, abbiamo:
Groq AI benchmark velocità

Diciamo che un token corrisponde in media a circa mezza parola. GPT-4 Turbo (a pagamento) raggiunge circa 20 T/s, analogo a Mistral AI, Google Gemini circa 50 T/s, GPT-3.5 (ovvero ChatGPT in versione gratuita) può variare fra 2 e 10 T/s, Groq AI ha già raggiunto i 300 T/s come pubblicato su wow.groq.com.

Non solo velocità, ovviamente vediamo anche l'aspetto legato alla qualità delle risposte! Devo dire che il tool è già più che buono (vista l'enorme crescita e competizione, negli ultimi mesi tutte queste aziende hanno sviluppato e introdotto migliorie, per software sempre migliori, più completi e affidabili). I modelli (LLM) disponibili che possiamo scegliere sono:

Gemma-7b-It
Llama3-70b-8192
Llama3-8b-8192
Mixtral-8x7b-32768 (a livello generale, è complessivamente il migliore)

Per testare la qualità di risposta, ho preso spunto da una domanda qui, Studio continuità e derivabilitá della funzione; considerato che le domande di matematica sono abbastanza critiche, difficili per questi tool (un tool di IA non ragiona ma fornisce una risposta su base probabilistica pescanndo da un database), la risposta è corretta e il tempo di esecuzione è stato pari a 1,94 secondi (pazzesco!!), con 567,29 T/s, velocità record. Anche ChatGPT mi ha risposto correttamente ma, forse era anche in un momento di traffico intenso, ha impiegato circa un minuto per fornire la risposta completa! Quindi una differenza di tempo davvero enorme. Vediamo uno screenshot, con parte della risposta (a parte la resa delle formule matematiche, non sempre questi tool riescono a rappresentare la simbologia di frazioni, radici, ecc, la risposta è corretta).
Groq AI test matematica

Cosa ne pensate? Conoscevate Groq AI? 🙂

user0101

Giulio_M
Perdonami, ma...non si sta " esagerando" con tutte queste AI?

Giulio_M

🔝 🔝

Giulio_M

user0101 diciamo che la direzione è quella di un costante miglioramento. Quando un'azienda lancia il proprio prodotto e questo ha successo (in ogni ambito, non riguarda solo l'IA) le altre aziende vogliono replicare, creare il loro prodotto per avere successo, prendere la propria fetta di mercato. Quindi è abbastanza normale che sia così, poi al giorno d'oggi nell'ambito internet, intelligenza artificiale, la velocità di crescita e cambiamento è esagerata, tutto all'estremo (potremmo anche in futuro continuare a "correre" in questo modo?). Di certo, come utenti consumatori, utilizzatori di queste tecnologie, nel giro di pochi mesi ci troviamo ad utilizzare prodotti sempre migliori, più evoluti e funzionali, che prima nemmeno potevamo immaginare.

user0101

Giulio_M
Grazie, per MR; 🙂
Buon proseguimento.

Giulio_M

Groq AI: Dev Console

Abbiamo visto che Groq AI è il tool di IA più veloce (ora viaggia 1200 token/s), avendo specificatamente puntato su una soluzione hardware sviluppata ad-hoc, LPU anziché le classiche CPU e GPU, quindi con risparmio di risorse e notevole aumento di efficienza. In groq.com, oltre alla chat usata in modo standard, possiamo anche andare su DEV CONSOLE, una funzionalità più avanzata per sviluppatori. È interessante poiché, anche in versione gratuita, possiamo settare diversi parametri: una vasta gamma di modelli, il numero di token (quanto vogliamo lunga la risposta generata), "temperature" (modello più predittivo e deterministico oppure una quota "random" nella generazione della risposta - si intende come modello linguistico, non il contenuto in sé). In risultato è molto interessante, ecco uno screenshot di un esempio.

groq-dev-console-esempio

Giulio_M

Vediamo alcuni aggiornamenti:

partnership strategica fra Hugging Face e Groq AI, in questo modo la piattaforma Hugging Face riesce a fornire accesso ultra veloce ai modelli di IA, grazie all'hardware specializzato di Groq AI (Language Processing Unit)
Hugging Face è valutata 4,5 miliardi di dollari (nel 2023)
Groq AI è valutata 2,8 miliardi di dollari, l'ultimo finanziamento consistente ad agosto 2024, pari a 640 milioni di dollari
Groq AI oggi consente di scegliere diversi modelli (famiglia Llama, Qwen, Mistral, ecc) fra cui anche Compound-Beta, presente di default, è un modello IA appositamente costruito da Groq AI, è composto da vari modelli open-source, quindi una combinazione dei precedenti