Lundi, Google a présenté son service expérimental de chatbot IA, Bard. Il s’agit bien évidemment de la réponse du géant au rival ChatGPT d’OpenAI. Le chatbot IA de Google sera testé par un nombre restreint d’utilisateurs avant d’être proposé au grand public dans les deux prochaines semaines.
Bard est alimenté par le modèle linguistique pour les applications de dialogue (LaMDA) de Google et s’appuiera sur toutes les informations du web pour fournir des réponses. C’est en soi un facteur de différenciation important par rapport à ChatGPT, qui ne peut accéder aux informations que jusqu’en 2021 et n’a pas accès au web.
« Bard cherche à combiner l’étendue des connaissances mondiales avec la puissance, l’intelligence et la créativité de nos grands modèles linguistiques », a déclaré Sundar Pichai, PDG de Google, dans le communiqué.
Google Bard explique les découvertes du télescope spatial James Webb à un enfant de 9 ans
Bard sera en mesure de synthétiser des sujets complexes en de petits morceaux de conversation. L’idée est d’accroître la diffusion des connaissances d’une manière qui soit compréhensible et qui puisse stimuler l’apprentissage de tous, y compris des enfants. Un exemple d’invitation à utiliser Bard pour expliquer les découvertes du télescope spatial James Webb de la NASA à un enfant de 9 ans est donné dans le communiqué.
Google
La version initiale de Bard utilisera un modèle léger de LaMDA (Language Model for Dialogue Applications) car il nécessite moins de puissance de calcul et peut être adapté à un plus grand nombre d’utilisateurs, selon le communiqué. Cela permettra à Google de recueillir davantage de commentaires avant de le diffuser au grand public.
Les commentaires internes et externes seront pris en compte pour s’assurer que Bard répond aux attentes en matière de qualité, de sécurité et de fiabilité, selon M. Pichai. Le communiqué de presse souligne l’engagement de Google à traiter l’IA de manière responsable afin de garantir qu’elle soit à la fois sûre et utile.
Les projets IA de Google restent souvent très discrets : l’exemple de MusicLM
Google adopte souvent cette approche, en conservant des services d’IA en interne jusqu’à ce qu’il soit certain qu’ils sont prêts pour le public. Par exemple, Google dispose d’un générateur d’images IA très performant, Imagen, et d’un générateur de musique IA, MusicLM, qui n’ont pas encore été mis à la disposition du public.
MusicML est pourtant un outil développé depuis quelque temps déjà par Google.
Son objectif : baisser drastiquement les coûts de production dans l’industrie musicale. Concrètement, c’est votre ordinateur qui crée le rythme et la mélodie dont vous avez besoin à partir de votre texte.
Google a récemment publié un article universitaire sur MusicLM. Le modèle peut créer un clip audio de 10
secondes ou une chanson complète, en utilisant tous les détails
spécifiques que vous lui donnez. Il peut également prendre une chanson
existante et la produire avec un son différent.
Selon l’article, les invites du modèle d’IA peuvent inclure des
commandes détaillées telles que « une chanson de jazz enchanteresse avec
un solo de saxophone mémorable et un chanteur soliste » ou « une techno
berlinoise des années 90 avec une basse basse et un kick puissant ». Pour
voir des exemples de ses différentes invites et capacités, vous pouvez
cliquer ici.
280 000 heures de musique non étiquetée pour s’entraîner
Pour créer la musique, le système est entraîné sur un ensemble de
données de 280 000 heures de musique non étiquetée qui apprend à MusicLM
à générer une musique longue et cohérente à 25 kHz, selon l’article.
Il ne s’agit pas de la première tentative de Google, ou de
l’industrie, de créer un système d’IA pour les chansons. OpenAI a sa
propre version, JukeBox, qui n’a pas encore été rendue publique.
Riffusion, un réseau neuronal qui produit de la musique à partir
d’images de sons, est déjà disponible. Selon Google, leur système est
meilleur que tout ce qui a été fait auparavant.
« Nos expériences montrent, par le biais de mesures quantitatives et
d’évaluations humaines, que MusicLM surpasse les systèmes précédents
tels que Mubert et Riffusion, tant en termes de qualité que de respect
de la légende », a déclaré Google.
MusicLM ? Trop de risque pour le mettre en musique
Alors, quand pourrons-nous utiliser ce modèle d’IA « meilleur que
tout ce qui existe » ? La réponse est, malheureusement, pas tout de
suite.
Dans le document, Google reconnaît le risque que ces types de
modèles pourraient poser sur le détournement de contenu ainsi que les
biais inhérents présents dans la formation qui pourraient affecter les
cultures sous-représentées dans la formation. Et conduire à de
l’appropriation culturelle. Pour toutes ces raisons, Google déclare ne
pas avoir l’intention de publier des modèles pour le moment.
Mais avec Google Bard, Google a décidé de renoncer à cette politique, poussé par la concurrence, et l’appétence du public.
Sundar Pichai avait déclaré la semaine dernière aux investisseurs
que la société allait laisser les gens « interagir directement » avec ses
modèles de langage les plus récents et les plus puissants en tant que
« compagnon de recherche ». De quoi montrer en creux que Microsoft a encore du chemin à parcourir avec OpenAI pour arriver au niveau de Google.
Car comme l’a souligné Yan LeCun, chef de l’IA chez Meta, la
semaine dernière, ChatGPT s’appuie sur la technologie Transformer de
Google – un fait que peu de personnes en dehors des cercles de recherche
sur l’IA connaissaient.
(function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0]; if (d.getElementById(id)) return; js = d.createElement(s); js.id = id; js.src = "//connect.facebook.net/fr_FR/all.js#appId=243265768935&xfbml=1"; fjs.parentNode.insertBefore(js, fjs); }(document, 'script', 'facebook-jssdk'));
Cliquez ici pour lire l’article depuis sa source.