Logo Spiria

Récap techno Spiria - № 369 - APIs OpenAI, GitHub Secret Scanning, battre l’IA à son jeu, Windows 12, LLaMA-13B

3 mars 2023.

Deux nouvelles APIs d’OpenAI

OpenAI logo.

© OpenAI.

OpenAI a annoncé la disponibilité d’APIs (interfaces de programmation d’applications) pour ses modèles d’intelligence artificielle ChatGPT et Whisper, ce qui permettra aux développeurs d’intégrer facilement ces fonctionnalités dans leurs applications, moyennant une redevance basée sur l’utilisation. Lancé fin novembre, ChatGPT est un robot conversationnel qui génère des textes cohérents dans de nombreux styles. Le prix d’accès à l’API est de 0,002 dollar pour 1 000 jetons (environ 750 mots), ce qui, selon OpenAI, est environ 10 fois moins cher que ses modèles GPT-3.5 existants. “Grâce à une série d’optimisations à la grandeur du système, nous avons obtenu depuis décembre une réduction des coûts de 90 % pour ChatGPT”, écrit OpenAI. Proposé à 0,006 dollar par minute, Whisper, un modèle de conversion de la parole en texte lancé en septembre, peut transcrire des enregistrements audio dans plusieurs langues ainsi que réaliser la traduction de ces langues en anglais.

En outre, en réponse aux préoccupations relatives à la protection de la vie privée concernant la collecte de données auprès de ses clients, OpenAI indique qu’elle a modifié ses conditions de service afin de ne plus s'autoriser à utiliser les données soumises pour améliorer le service, y compris la formation des futurs modèles. Aussi, la politique de conservation des données par défaut est de 30 jours pour les utilisateurs de l’API, et les conditions de service soulignent que les utilisateurs sont propriétaires des entrées et des sorties des modèles d’IA.

Ars Technica, Benj Edwards, “ChatGPT and Whisper APIs debut, allowing devs to integrate them into apps.”

2023-03-01

GitHub veut mieux protéger vos secrets

Secret scanning alerts.

© iStock.

GitHub a annoncé que son service d’alertes de détection de “secrets” est désormais disponible pour tous les dépôts publics et qu’il peut être activé pour détecter les fuites de secrets dans tout l’historique de publication. Les “secrets” sont des données sensibles laissées par inadvertance dans le code et qui se retrouvent ajoutées accidentellement aux dépôts GitHub, notamment des clés d’API, des mots de passe, des jetons d’authentification et d’autres données confidentielles qui peuvent permettre aux attaquants de réaliser des intrusions. Des acteurs malintentionnés ont souvent recours aux dépôts publics de GitHub pour y trouver des données d’authentification et pouvoir pénétrer dans les réseaux, voler des données ou encore usurper l’identité d’une entreprise dans leurs propres attaques. GitHub avait commencé à déployer une version bêta de cette fonction gratuite de détection des secrets en décembre 2022 afin d’aider les développeurs à déceler l’exposition publique accidentelle de données sensibles. Depuis lors, 70 000 dépôts publics ont activé la nouvelle fonctionnalité et tous les propriétaires/administrateurs de dépôts publics peuvent activer ces alertes pour sécuriser leurs données.

GitHub partage l’exemple offert par le consultant et formateur DevOps Rob Bos pour souligner la puissance du détecteur de secrets. Après avoir activé la fonction sur 13 954 dépôts publics GitHub Actions, Rob a trouvé des secrets sur 1110 d’entre eux (7,9 %).

The GitHub Blog, Zain Malik, Mariam Sulakian, “Secret scanning alerts are now available (and free) for all public repositories.”

2023-03-01

Jeu de go : un humain parvient à battre l’IA

Go game.

Futur champion. © iStock.

En 2016, grâce au logiciel AlphaGo de DeepMind Technologies, un ordinateur parvenait enfin à battre un champion humain au jeu de go. Cette victoire de l’IA avait d’autant plus marqué les esprits que le go est souvent considéré comme le plus complexe de tous les jeux de société. Aujourd’hui, dans un inattendu renversement de situation, c’est un joueur humain, Kellin Pelrine, qui a réussi à avoir le dessus sur l’ordinateur en remportant 14 des 15 parties l’opposant à l’IA. Mais Pelrine a eu recours à une astuce : il a fait appel à un programme spécialement conçu pour détecter des faiblesses de l’IA jusqu’alors inconnues. La tactique, trouvée par le logiciel au cours de plus d’un million de parties, consiste à assembler lentement une grande “boucle” de pierres pour encercler l’un des groupes de son adversaire, tout en distrayant l’IA avec des mouvements dans d’autres coins du plateau. Le robot joueur de Go n’a pas remarqué sa vulnérabilité, même lorsque l’encerclement était presque complet, alors que n’importe quel joueur humain l’aurait très vite remarqué. Bref l’IA a été complètement déstabilisée par une stratégie de jeu tout à fait inusitée, qui ne faisait probablement pas partie de ses données d’entraînement.

Ars Technica, Richard Waters, “Man beats machine at Go in human victory over AI.”

2023-02-19

Windows 12 pointe déjà son nez ?

Ryzen 7040.

Ryzen 7040. © Advanced Micro Devices.

On sait déjà, selon plusieurs sources (par exemple chez Windows Central), que Microsoft envisagerait un nouveau cycle de développement de trois ans pour les versions majeures de son système d’exploitation. Entre ces versions majeures, des mises à jour plus petites permettent à Microsoft d’offrir une cadence régulière de nouvelles fonctionnalités. Si l’on en croit ce nouveau calendrier, la prochaine version majeure devrait voir le jour au second semestre de 2024, et un premier indice viendrait supporter cette thèse : un internaute a repéré dans une communication d’Intel qui a fuité que les futurs processeurs de bureau Meteor Lake-S de 14e génération étaient listés comme prenant en charge “Windows 12”. On sait que les premiers processeurs Meteor Lake devraient arriver à la fin de 2023.

Il y a fort à parier que la prochaine version de Windows utilisera intensivement l’IA, et il est donc probable que Microsoft travaille en étroite collaboration avec ses partenaires matériels comme Intel et AMD pour produire des puces optimisées pour l’IA. Signe des temps, AMD a dévoilé au début de l'année le Ryzen 7040, le premier processeur x86 dédié aux portables à être doté d'un moteur d'IA intégré.

Tom’s Hardware, Brandon Hill, “Intel Meteor Lake Leak Points to Windows 12 Support.”

2023-03-01

Un nouveau modèle de langage par Meta/Facebook

LLaMA.

© iStock.

Meta a annoncé LLaMA-13B, un nouveau grand modèle de langage (LLM) alimenté par l’IA qui, selon l’entreprise, peut surpasser le modèle GPT-3 d’OpenAI bien qu’il soit “10x plus petit”. Des modèles d’IA de plus petite taille pourraient permettre d’exécuter localement des assistants de type ChatGPT sur des appareils tels que les PC et les téléphones intelligents. LLaMA-13B fait partie d’une nouvelle famille de modèles de langage appelée “Large Language Model Meta AI”, ou LLaMA en abrégé. Meta a formé ses modèles LLaMA à l’aide d’ensembles de données accessibles au public (Common Crawl, Wikipedia, C4, etc.), ce qui les rend compatibles avec l’open-sourcing. L’entreprise souhaite que ces modèles fondamentaux forment la base technologique de futurs modèles d’IA plus raffinés, de la même manière qu’OpenAI a construit ChatGPT à partir d’une fondation GPT-3. Une version simplifiée de LLaMA est disponible sur GitHub.

LLaMA ouvre la voie à des performances similaires à celles de ChatGPT sur du matériel grand public dans un avenir proche. Le nombre de paramètres d’un modèle de langage est un facteur clé de ses performances, les modèles plus grands étant généralement capables de traiter des tâches plus complexes et de produire des résultats plus cohérents. Cependant, un plus grand nombre de paramètres prend plus de place et nécessite plus de ressources de calcul pour fonctionner. La taille des modèles de langage de la collection LLaMA varie de 7 à 65 milliards de paramètres. En comparaison, le modèle GPT-3 d’OpenAI — le modèle de base de ChatGPT — compte 175 milliards de paramètres. Meta n’a pas annoncé de plans pour une version plus large du modèle pour le moment.

Ars Technica, Benj Edwards, “Meta unveils a new large language model that can run on a single GPU.”

2023-02-24