Storie di bit
L'uscita di questa newsletter è terminata con giugno 2024.
Grazie a tutti per il supporto!

Le storie della settimana

17 marzo 2024

Oggi:

• La prima intervista a Pavel Durov dal 2017 • Reddit si prepara all’ingresso in Borsa • Il Parlamento europeo ha approvato l’AI Act

• La barriera di GPT-4 è stata superata? • Claude 3 su AWS (e chi ha bisogno di chi) • L’ultima promessa di Elon • Midjourney 🔫 Stability AI • Preoccuparsi o non preoccuparsi • In attesa del «campione nazionale» • Meta fa scorta di GPU • E Google si è persa

• Fastweb 💛 Vodafone • Cosa sta combinando TIM

• Un nuovo attacco ai modelli linguistici in streaming

• Street View conquista la Germania • L’Unione Europa ha violato il GDPR

Iscriviti alla newsletter

Non perderti le prossime uscite! Iscriviti alla newsletter per ricevere ogni weekend via email le storie più interessanti della settimana.

Regole di Internet

• La prima intervista a Pavel Durov dal 2017

Il Financial Times ha intervistato per la prima volta da anni il fondatore di Telegram, Pavel Durov. Nonostante abbia quasi un miliardo di utenti attivi Telegram è una delle piattaforme più misteriose e meno trasparenti: si hanno pochissime informazioni sulla società che ci sta dietro, la sua struttura, gli investitori.

Il tema ha una certa rilevanza perché negli ultimi anni l’app è stata spesso al centro di controversie per le sue regole di moderazione molto vaghe e spesso inapplicate anche in presenza di contenuti palesemente illegali.

Una novità è che in vista delle elezioni di quest’anno in Europa e negli Stati Uniti Telegram intende sfruttare di più l’intelligenza artificiale per la moderazione dei contenuti (secondo alcuni rumor sarebbe in cantiere anche un’integrazione con GPT-4 per gli abbonati Premium Business).

L’obiettivo di Telegram è restare indipendente ma con l’intenzione di quotarsi in Borsa, probabilmente negli Stati Uniti, già nel 2025, con una capitalizzazione stimata di 30 miliardi di dollari. Entro 12-14 mesi Durov prevede inoltre di superare il miliardo di utenti attivi mensili (ora sono 900 milioni e ognuno costa a Telegram 0,7 $ all’anno); grazie a pubblicità e abbonamenti Telegram dovrebbe iniziare anche a generare profitti per la prima volta. Questa crescita dovrebbe permettere a Telegram di iniziare a inserire nuove funzioni AI nell’app, in modo da attrarre più investitori e utenti.

Nessuna variazione in vista però per la sede di Telegram, che da qualche anno è a Dubai, dove «il governo non ci infastidisce ed è neutrale», dice Durov (che con un patrimonio di 11 miliardi di dollari ha certamente tratto vantaggio dal regime di “paradiso fiscale” degli Emirati Arabi Uniti).

Dal punto di vista tecnico Telegram è ancora uno straordinario mix di produttività, qualità e affidabilità, sorprendente se si considera che il team di Telegram è composto da solo 50 persone, di cui 30 ingegneri, con un profondo coinvolgimento diretto di Durov in tutte le decisioni. Gli amministratori di rete sono 7 e gestiscono con molta automazione gli oltre 80.000 server distribuiti globalmente nei datacenter. Ci sono poi dei collaboratori esterni che si occupano della moderazione dei contenuti.

• Reddit si prepara all’ingresso in Borsa

Nei prossimi giorni è attesa l’offerta pubblica iniziale (IPO) di Reddit, con cui l’azienda inviterà gli investitori ad acquistare azioni in vista dell’ingresso in Borsa.

In un lungo articolo uscito qualche giorno fa Wired ripercorre la storia di Reddit e si chiede: «Riuscirà Reddit a sopravvivere al suo stesso IPO?». La società si è infatti trasformata dall’essere un progetto fortemente basato sulla community, spinto dagli oltre 60.000 moderatori volontari non pagati, a una tipica azienda di tecnologia americana con la missione principale di generare crescita e profitti, un obiettivo che tra l’altro sta avendo difficoltà a raggiungere.

Il grosso dubbio è se questa strategia, che l’anno scorso aveva causato l’ennesima rivolta quando Reddit ha costretto le app di terze parti a chiudere, farà venire meno il supporto della community.

«There’s no way to grow by a factor of five, of course, without alienating some loyal diehards. But Reddit kept falling into patterns that aggravated core users without netting many gains. […] There’s also no getting around that IPOs force technology companies to change. And the coming shifts could be particularly wrenching for a volunteer-powered, community-centered platform like Reddit.»

• Il Parlamento europeo ha approvato l’AI Act

Il nuovo regolamento europeo classifica in categorie di rischio le tecnologie di intelligenza artificiale. Abbiamo tutti in mente OpenAI e ChatGPT in questo momento, ma la proposta iniziale risale al 2021 e si concentra principalmente su pratiche e tecnologie ad alto rischio, in cui l’AI generativa non sembra rientrare. È ad esempio vietato il riconoscimento biometrico basato su dati sensibili e la categorizzazione delle persone, così come la creazione di punteggi sociali. Per quanto riguarda i sistemi ad alto rischio, cioè quelli che possono avere un impatto sulla sicurezza o sui diritti fondamentali delle persone, è invece richiesto che le aziende svolgano delle autovalutazioni di rischio. Per tutto il resto non cambia quasi niente. (Parlamento Europeo, Il Post, LegalBlink)

Una percezione molto diffusa è che l’Unione Europea si diletti nel regolamentare anche quando non ce n’è bisogno, ma a guardar bene le regole introdotte da questo regolamento hanno una portata abbastanza limitata e sono di buon senso (c’è anche chi sostiene che siano state diluite eccessivamente). Sembra quindi difficile che freneranno l’innovazione, e come avvenuto con il GDPR è probabile che poi il resto del mondo prenda spunto. L’AI Act entrerà in vigore gradualmente nel corso dei prossimi due anni.

We are regulating as little as possible — but as much as needed!

Intelligenze artificiali

• La barriera di GPT-4 è stata superata?

Il 14 marzo è stato il giorno dell’anniversario del lancio di GPT-4, il modello linguistico (LLM) di punta di OpenAI che tutti i concorrenti stanno provando a raggiungere con difficoltà da un anno. Nelle ultime settimane sembra però che le cose stiano cambiando: i principali competitor di OpenAI hanno annunciato diversi modelli aggiornati che in molti casi si avvicinano alla qualità di GPT-4.

È ad esempio il caso di Gemini 1.5 di Google, che specialmente su input molto lunghi mostra capacità di ragionamento sorprendenti. C’è poi la francese Mistral che ha annunciato il modello Large, con prestazioni confrontabili a GPT-4 e una particolare specializzazione sulle principali lingue europee. È tornata alla carica anche Anthropic, nata nel 2021 da una scissione di OpenAI, che grazie al nuovo modello Claude 3 Opus ha permesso a molti osservatori di azzardare che GPT-4 sia stato effettivamente battuto (nell’utilizzo reale e non solo nei benchmark). (Simon Willison)

• Claude 3 su AWS (e chi ha bisogno di chi)

La nuova famiglia di modelli di Anthropic, Claude 3, è ora disponibile anche su Amazon Web Services (AWS). La strategia di Amazon è chiaramente fondata sulla preoccupazione di restare tagliata fuori dalla nuova ondata di entusiasmo derivante dall’AI generativa: se Microsoft ha una stretta collaborazione con OpenAI (i cui modelli sono disponibili sul cloud Azure) e Google Cloud può vantare Gemini, Amazon non ha un LLM competitivo a disposizione. Per questo sta provando a posizionarsi come il “marketplace” dei modelli generativi, tra cui appunto quelli di Anthropic, di Cohere, AI21 Labs, Meta e Stability AI. Qualcuno ha ironizzato sul fatto che l’annuncio di AWS su Claude 3 nomina Anthropic 20 volte, mentre quello di Anthropic menziona AWS soltanto una volta, suggerendo chi sia dei due a essere più entusiasta della partnership.

• L’ultima promessa di Elon

Lunedì scorso Elon Musk ha annunciato che questa settimana l’LLM di xAI, chiamato Grok, sarebbe diventato open source. Finora non si è visto nulla e Grok resta disponibile solo per gli abbonati a X Premium+ al costo di 16 €/mese. (Twitter)

• Midjourney 🔫 Stability AI

Qualche giorno fa Midjourney ha accusato la rivale Stability AI di stare sfruttando in massa il servizio per generare immagini, con il presunto obiettivo di generare nuovi dati per il training. Entrambe le aziende infatti producono dei modelli per la generazione di immagini e Midjourney in particolare è considerata leader nel campo: le immagini generate da Midjourney v6 sono infatti di una qualità stupefacente che nemmeno OpenAI finora è riuscita a eguagliare. (80 Level, The Verge)

La stranezza di Midjourney è che non è disponibile tramite un sito web e nemmeno tramite delle API, ma soltanto tramite Discord. Il servizio è in abbonamento e dà la possibilità di generare immagini partendo da un prompt inviato a un bot Discord, pagando in base alle ore di tempo GPU utilizzate.

• Preoccuparsi o non preoccuparsi

Un anno fa al lancio di GPT-4 era seguita una fase di allarmismo per la preoccupazione che queste nuove AI generative potessero iniziare a sostituire i lavoratori di certi settori più rapidamente del previsto. Ad esempio una demo di OpenAI mostrava come GPT-4 fosse in grado di creare il codice di un sito web a partire da uno schizzo disegnato su un foglio e aveva generato previsioni distopiche per un futuro vicino dominato dall’AI, ipotesi che ora sappiamo non si sono avverate (nemmeno lontanamente). (Twitter)

La cosa di cui forse conviene inziare a preoccuparsi concretamente è quella che Il Post sintetizza con la domanda: «Questa foto è una vera foto?». I fotoritocchi e i fotomontaggi sono sempre esistiti, ma fino ad ora erano prevalentemente operazioni complesse che richiedevano competenze specifiche come saper usare bene Photoshop. Oggi è possibile alterare significativamente le immagini (o generarne di nuove del tutto indistinguibili da fotografie reali) con uno sforzo e dei costi molto bassi. I tentativi di introdurre watermark invisibili che possano marchiare una foto come generata o modificata con intelligenza artificiale finora non stanno avendo grandi risultati, banalmente perché questi watermark sono rimovibili.

• In attesa del «campione nazionale»

Il sottosegretario per l’innovazione italiano Alessio Butti ha anticipato la nuova strategia del governo sull’intelligenza artificiale, che punta ad avere un «campione nazionale» che possa competere come sta facendo Mistral in Francia: «Stiamo costituendo un fondo di venture capital gestito da Cassa depositi e prestiti che, compreso l’effetto moltiplicatore, avrà una dotazione trai 600 e gli 800 milioni di euro. Alcuni dicono che è poco, ma meglio poco che nulla: quella cifra in Europa ci mette subito dopo Francia e Germania». (Governo, StartupItalia)

Potremmo però stare guardando al problema sbagliato: secondo uno studio che ha stimato quali Paesi del mondo formano più ricercatori esperti in AI, Francia e Germania sono rispettivamente al 5% e al 4% mentre l’Italia è in “altro”.

• Meta fa scorta di GPU

Meta ha condiviso un po’ di dettagli tecnici sui nuovi cluster di GPU che serviranno per il training di Llama 3: si parla oggi di circa 50mila GPU a cui entro la fine dell’anno si aggiungeranno 350mila NVIDIA H100 portando la capacità totale equivalente a 600mila H100. Un abisso in confronto alla dotazione delle università, che a differenza del passato rischiano di diventare meno rilevanti nel lavoro di ricerca su modelli di grandi dimensioni. (Meta Engineering)

• E Google si è persa

Un thread Twitter su come l’esperienza per gli sviluppatori che vogliono usare il modello Gemini di Google sia frammentata, confusionaria e contradditoria. A quanto pare, scopro ora, esistono due API diverse per Gemini.

Reti e TLC

• Fastweb 💛 Vodafone

Fastweb e Vodafone si fonderanno nel 2025. La società che possiede Fastweb, cioè l’operatore svizzero Swisscom, ha annunciato che è stato raggiunto un accordo per l’acquisizione di Vodafone Italia per 8 miliardi di euro.

L’accordo prevede che il marchio Vodafone possa essere usato al massimo per 5 anni: possiamo quindi iniziare ad abituarci al fatto che non ci sarà più Vodafone in Italia (come del resto era in origine con Omnitel). È ancora presto per i dettagli, ma si sa che Fastweb sogna da un po’ di tempo di avere una rete mobile di proprietà e con questa acquisizione potrà vantare una delle migliori (se non la migliore) reti mobili in Italia e i clienti Fastweb potranno sicuramente beneficiarne. Attualmente Fastweb si appoggia a WindTre e TIM.

Acquisendo i clienti Vodafone, Fastweb diventerà un grosso operatore da più di 7 miliardi di fatturato (dai 2,6 attuali), il primo operatore FTTH in Italia (36% del mercato) e il più grande nella telefonia mobile con 33 milioni di SIM. Non è al momento chiaro cosa succederà a Ho. Mobile, il secondo brand di Vodafone, che potrebbe diventare superfluo. (Trovate altri numeri e dettagli in questa presentazione.)

Swisscom non ha i soldi per questa acquisizione e dovrà perciò indebitarsi significativamente. Il gruppo Vodafone invece festeggia perché tra la vendita di Vodafone Italia e Vodafone Spagna recupererà 12 miliardi di euro, in un contesto in cui sta provando a migliorare la propria situazione finanziaria uscendo dai mercati meno remunerativi. (Swisscom, Il Sole 24 Ore, Il Post)

• Cosa sta combinando TIM

I giornali parlano da giorni di «débâcle in Borsa senza precedenti», ed è rilevante perché nonostante gli inciampi TIM è ancora l’operatore più grande in Italia non solo in termini di clienti e forza commerciale ma anche di estensione della rete.

Al momento TIM si trova in un limbo particolare perché sta provando da tempo a mettere in pratica il piano di scorporo presentato quasi due anni fa: vuole cioè vendere la propria rete fissa in modo da concentrarsi sulla vendita dei servizi e sulla rete mobile. L’anno scorso ha ricevuto due offerte: una da Cassa Depositi e Prestiti (che fa capo al ministero dell’economia) e una dalla società di investimento americana KKR. Ha scelto la seconda opzione, un’offerta dal valore di 18 miliardi di euro, e si sono poi aggiunti altri investitori tra cui anche il ministero dell’economia.

La settimana scorsa TIM ha presentato un nuovo piano industriale e questa volta è un piano decisivo: è la prima volta che si tiene conto degli effetti dello scorporo sul futuro di TIM e c’erano quindi delle aspettative. Gli investitori l’hanno presa male: il titolo in Borsa ha perso circa il 24% in un giorno, nei giorni successivi è persino peggiorato e in tre giorni è stato scambiato il 30% delle azioni. È quasi il peggior risultato mai fatto da TIM in Borsa e, si sa, in Borsa si scende con l’ascensore e si sale con le scale, per cui potranno servire dei mesi per recuperare.

I motivi di questa mancanza di fiducia hanno in larga parte a che fare con l’enorme debito di TIM, che ammonta a circa 26 miliardi di euro, più di 5 volte il margine operativo dell’intero gruppo e quasi il doppio del fatturato. Con i proventi dello scorporo si prevede di abbassare il debito a 6,1 miliardi, che però crescerà fino a 7,5 miliardi quest’anno per poi scendere a 7 miliardi a fine 2026, un paradosso che non ha convinto gli investitori. (Il Sole 24 Ore, Repubblica+)

Resta poi da vedere come TIM pensa di competere concretamente in un mercato affollato e poco remunerativo come quello delle telecomunicazioni, dove non a caso Fastweb e Vodafone si stanno unendo. Dopo lo scorporo, a TIM resteranno circa 18mila dipendenti, un numero molto più alto rispetto ai concorrenti (Iliad ne ha meno di mille, Vodafone e WindTre 7mila). In ogni caso, se credete in TIM è il momento giusto per investire. L’ha fatto anche Pietro Labriola, l’amministratore delegato, che ha comprato 500.000 azioni a 0,20 € l’una, un prezzo molto conveniente. (Investing)

Cybersecurity

• Un nuovo attacco ai modelli linguistici in streaming

Dei ricercatori israeliani hanno identificato una nuova vulnerabilità nel modo in cui sono usati i modelli linguistici come ChatGPT. Quando questi modelli sono usati tramite Internet i singoli token generati dal modello sono trasmessi in streaming, producendo l’effetto che ormai conosciamo della risposta che compare un pezzetto alla volta.

Questo modello di funzionamento permette però a un attaccante di usare la lunghezza dei singoli pacchetti di streaming per ricostruire tramite statistica, euristiche o altri modelli dedicati il testo originale, realizzando così una specie di keylogger nonostante la trasmissione sia cifrata. I ricercatori hanno dimostrato (qua un video demo) che un attacco di questo tipo non è solo teoricamente possibile ma realizzabile senza tanto sforzo nella pratica. Il principio di funzionamento è simile a quello di vulnerabilità che hanno fatto la storia della cybersecurity, come BREACH del 2012. OpenAI e Cloudflare hanno già applicato delle patch per mitigare il problema. (ArsTechnica, Cloudflare)

Privacy

• Street View conquista la Germania

Google sta facendo un secondo tentativo, dopo il primo fallito del 2010, di mappare strade e città su Street View. Sta trovando molta meno resistenza rispetto al passato. Qua la storia completa (riassunto: i tedeschi tengono particolarmente alla privacy).

• L’Unione Europa ha violato il GDPR

L’EDPS, l’organismo che supervisiona le autorità per la privacy europee, ha stabilito che la Commissione Europea sta usando la suite Microsoft 365 in violazione del GDPR, il regolamento europeo per la privacy. La motivazione è un problema che tormenta mezza Europa da anni: si possono trasferire dati personali negli Stati Uniti se gli Stati Uniti non dispongono di leggi adeguate per la protezione dei dati personali? Se non ce la fa la UE stessa, difficilmente potranno farcela aziende e altri enti. (EDPS, Cybersecurity360)

Appunti

Iscriviti alla newsletter

Non perderti le prossime uscite! Iscriviti alla newsletter per ricevere ogni weekend via email le storie più interessanti della settimana.

</ in ~21 kB >