xAI è l'azienda fondata da Elon Musk nel 2023, una startup che ha come focus l'Intelligenza Artificiale, in particolare l'IA generativa, vorrebbe essere la rivale di OpenAI (azienda che ha prodotto il noto ChatGPT, per intenderci).
xAI ha rilasciato il modello Grok (ora in versione 2, in corso lo sviluppo della versione 3) e fino a poco tempo fa, era possibile testarlo solo con account premium X.com (ex Twitter) e Aurora, che è il modello proprietario text-to-image creato sempre da xAi. Ora invece, da dicembre 2024 l'accesso è libero a tutti e si può accedere da x.ai ("Try now on X").
Che dire, Elon Musk da tempo non faceva altro che "vendere bene" il proprio prodotto, sostenendo che aveva già superato la concorrenza, bla bla bla. Ora vista la popolarità di Musk a livello globale, il suo appoggio a Trump per le elezioni americane, anche xAI ha guadagnato moltissimo in termini di finanziamenti (valutazione di circa 50 miliardi di dollari, il doppio negli ultimi sei mesi, per confronto però OpenAI è valutata 157 miliardi). Per la qualità del risultato però non bastano i soldini... (non a caso, anche Google Gemini è comunque in media inferiore a ChatGPT, nonostante il colosso Google abbia indiscutibile leadership come motore di ricerca e intero ecosistema online)
Da notare che Grok non è Groq. Groq AI è un'azienda che ha sviluppato un chatbot con una vera e propria rivoluzione hardware (qualità dei modelli comunque buona, ma soprattutto è ultraveloce, fa uso di LPU - tecnologia proprietaria - al posto delle più tradizionali GPU). Anzi Groq AI proprio prende in giro Elon Musk: <<Welcome to Groq’s Galaxy, Elon [...] Hey Elon, It’s Time To Cease & De-grok>>.
Il test complessivamente ha un po' deluso le aspettative - cioè non male, ma di certo nemmeno il top assoluto come da propaganda - (Elon Musk può dire quello che vuole, io riporto i risultati 😅 ), la qualità di Grok non è, almeno oggi, al pari della concorrenza (ChatGPT in primis, molto bene Mistral AI, abbastanza bene anche Groq AI, Google Gemini, ecc)
Grok 2 - domanda generale, ambito scientifico
Relatività generale: dalla relatività galileiana, la velocità in relazione alla velocità della luce da origine alla relatività ristretta, poi si aggiunge la gravitazione per la relatività generale. Quale altro componente potrebbe essere ancora aggiunto per una più universale teoria?
La risposta in sé è stata sufficiente (non la riporto per intero, essendo troppo lunga); a differenza però di ChatGPT, Grok non prova a spingersi oltre ma si limita ad elencare le preesistenti teorie, con riferimento alla meccanica quantistica (teoria delle stringhe, gravità quantistica...), in pratica la risposta - pur valida di per sé - sembra un copia-incolla di Wikipedia, strutturato in punti con breve descrizione
Grok 2 - analisi di immagine (ambito finanza e trading)
(ho allegato un'immagine, grafico di TradingView)
Finanza e trading, grafico ad un anno di Mediobanca. A cosa sono dovuti questi gap (al ribasso, vedi l'ultimo a novembre 2024). Considera che il gap al ribasso è avvenuto circa una settimana prima del pagamento del dividendo (stacco cedola 18 novembre 2024). Posso aspettarmi una crescita, gap positivo? Come interpreti la situazione?
La riposta è mediamente valida ma piuttosto generica, resta sul vago e teorico. Per confronto, ChatGPT si era sbilanciato indicandomi una strategia operativa breve vs lungo termine, mentre Grok mi dice fondamentalmente di "tener monitorato" e "prestare attenzione alle notizie" (grazie al cavolo!). Diciamo che fornisce un background tecnico teorico, più che capacità di "ragionamento"
Grok 2 - Tell me about this trend: #29dicembre
Questa funzionalità è carina, essendo ovviamente legato a X.com. Esegue una ricerca per hashtag, risultati riportati in lingua inglese. Andrebbe però migliorata, perché ora come ora è abbastanza inutile. Il risultato, in sintesi, è questo: "alcuni individui compiono gli anni oggi e ricevono gli auguri da amici e followers", "è un periodo intermedio fra Natale e il nuovo anno, una domenica calma e di riflessione, possibili celebrazioni personali", "c'è un senso di partecipazione della community di X.com, con hashtag e condivisioni" (seee, poca propaganda a favore di X.com insomma 😅); dai, se questa funzionalità venisse rivista e migliorata, sarebbe interessante.
Grok 2- domanda specifica di matematica
Premetto che questo è una richiesta mooolto difficile per un software (anche ChatGPT spesso sbaglia, non è affidabile almeno ad oggi), ben diverso da chiedere una sintesi di un argomento. Comunque sia, volevo valutare "fino a dove arriva" almeno come impostazione. La domanda è stata:
Analisi matematica 2: identificare i punti stazionari di f(x.y)=|x-y| (x2 + y2 -1), dove |x-y| indica il valore assoluto.
Grok capisce che deve suddividere i due casi (x>=y e x<y), poi però ha cannato i risultati fin da subito, quindi risultato finale sbagliato (la procedura nei vari passaggi è corretta); ChatGPT ha fatto un po' meglio poiché delle otto soluzioni ne ha riportate quattro (queste corrette), Grok ne ha riportate due, entrambe sbagliate. Insomma in questo test ha fallito, al massimo possiamo chiedere "indicami la procedura" e poi tutti i conti li facciamo noi a mano.
Grok 2 - Excel / programmazione
LibreOffice Calc: vorrei invertire una colonna in base a questo semplice criterio: ordine inverso. Il primo valore voglio che sia l'ultimo, mentre l'ultimo valore voglio che sia il primo. Esempio, supponiamo di avere (scorrendo lungo la colonna) A B C D, io voglio in questo caso D C B A. Tramite filtri personalizzati si complica inutilmente. Come risolvo?
Qui era un caso pratico, con LibreOffice Calc (software analogo a Microsoft Excel): la soluzione, anche semplice a cui non avevo pensato (tramite una colonna di supporto) me l'aveva fornita ChatGPT, quindi risolvendomi il problema. Grok non mi ha fornito la soluzione, ovvero mi consiglia una strada che non funziona, alla fine mi dice <<Se la tua colonna contiene formattazioni speciali o formule, questa operazione potrebbe non preservare tali caratteristiche>>. Quindi la strada consigliata in questo caso non ha funzionato.
Grok 2 - programmazione web (PHP, ambiente WordPress)
Ho bisogno di un codice PHP da inserire in functions.php di WordPress, per evitare il caricamento di un plugin (file CSS e JavaScript) nelle pagine non desiderate (ad esempio escludere il caricamento di Contact Form 7 nelle pagine in cui non è richiesto)
Più che risolverlo, credo abbia eseguito una ricerca online. In realtà da quanto trovo documentato, mi fornisce una soluzione anche "più moderna ed elegante" rispetto a quella che avevo adottato io 😁 (nello specifico wp_enqueue_scripts
anziché wp_print_scripts
, wp_print_styles
e usa sia dequeue_*
sia deregister_*
al posto solamente del secondo come ho fatto io, è anche potenzialmente ridondante). Potendo trovare una risposta online non è un "vero test" come risolvere un compito di matematica nuovo, comunque sia risposta corretta.
Grok 2 - traduzione
Mi puoi tradurre questo testo? ダイキン工業株式会社 Di quale lingua si tratta, quali alfabeti compaiono?
Correttamente identifica Daikin Industries, Ltd., lingua giapponese, alfabeti Katakana e Kanji. ChatGPT lo risolve correttamente, altri tool identificano solo Katakana, poi si perdono (forse per risparmio di risorse, non vnano oltre).
Grok 2 - sintesi di un testo
Ho chiesto di sintetizzare una discussione scritta da me, va beh domanda idiota perché l'avevo già scritta in punti. Comunque elabora gli aspetti più importanti e li sintetizza in punti come ho chiesto, risultato valido.
Grok 2 - generazione di immagini
(per maggiore accuratezza del tool, lo scrivo in inglese)
Draw me a white rabbit near a gold Tesla Cybertruck
Vengono generate quattro immagini, che dire, risultato discreto come qualità, angolazione fatta un po' a caso (vero che non l'ho specificata, ma tagliare il soggetto non credo sia opportuno). La seconda e terza immagine sono complessivamente valide.

Conclusioni
Che dire, Elon Musk non fa altro che vantarsi della sua xAI, della nuova versione di Grok che sì, certamente è migliore della precedente, ma almeno oggi non è ancora al top, quantomeno in alcuni compiti più complessi e delicati (nessuno è totalmente affidabile!!) ChatGPT dimostra di avere quel "qualcosa" in più, sia nell'affidabilità, sia nella qualità della risposta che viene presentata. La cosa divertente è che xAI ha pubblicato benchmark su test specifici in cui ha superato gli altri modelli. Nel complesso con Grok 2 la qualità è abbastanza buona, un tool valido, ma il voto complessivo non va oltre la media. Specialmente vista la propaganda, mi aspettavo maggiore affidabilità anche in compiti "non semplici".
Avete già provato xAI, farete contenti Elon Musk con un bel +1 al numero di utenti? 🙂