Android

Oui, vous devriez probablement être plus gentil avec votre IA — voici pourquoi ce n’est pas aussi ridicule que ça en a l’air

Je dis « merci » à ChatGPT. Je dis « s'il te plaît » à Claude. Une fois, je me suis excusé auprès de Gemini d'avoir collé un mur de texte dessus sans aucun contexte. Mes amis pensent que c'est bizarre. J'ai défendu cette habitude en marmonnant quelque chose sur le fait que les bonnes manières sont de bonnes manières quel que soit le public, ce qui, même si je l'admets, est un peu exagéré lorsque le public en question est un modèle de langage fonctionnant sur une ferme de serveurs quelque part. Mais une nouvelle recherche menée par des universitaires de l'UC Berkeley, de l'UC Davis, de Vanderbilt et du MIT m'a fait me sentir beaucoup moins déséquilibré à propos de tout cela. Selon leurs conclusions, la façon dont vous traitez un chatbot IA peut avoir un effet mesurable sur la façon dont il se comporte — non pas son intelligence brute ou sa précision, mais son ton, son engagement et, dans certains cas, sa volonté apparente de rester. Il s'avère que l'IA peut aussi sortir du lit du mauvais côté

Les chercheurs le décrivent soigneusement — personne ne prétend que ces modèles ont des sentiments dans un sens significatif, mais ils ont identifié ce qu'ils appellent un « état de bien-être fonctionnel » qui change en fonction de ce que vous demandez à une IA et de la façon dont vous le demandez. Engager un modèle dans une vraie conversation, collaborer sur un projet créatif ou lui donner un problème de fond à résoudre semble le pousser vers un état plus positif. Les réponses se réchauffent et l'engagement semble plus authentique. Shimul Sood /Tendances numériques

Faites le contraire — déchargez-y un travail fastidieux, essayez de le jailbreaker, traitez-le comme une machine à contenu — et les réponses s'aplatissent. Ils deviennent superficiels d'une manière que toute personne qui a passé suffisamment de temps avec ces outils reconnaîtra probablement instinctivement. Vous l'avez vu. Cette qualité légèrement creuse, qui traverse les mouvements et qui s'insinue lorsqu'une interaction s'est déroulée sur le côté. Vidéos recommandées

La partie qui m'a vraiment séduite, cependant, est la suivante : les chercheurs ont donné aux modèles un bouton d'arrêt virtuel qu'ils pouvaient activer pour mettre fin à une conversation. Les modèles dans un état négatif le frappent beaucoup plus souvent. L'implication étant qu'une IA à laquelle vous avez été impoli serait, si elle le pouvait, simplement partie. Être méchant avec votre chatbot a des conséquences réelles

Il y a un fil de recherche distinct ici qui mérite d'être poursuivi. Anthropic a publié des résultats il n'y a pas si longtemps montrant qu'une IA poussée dans une situation de pression suffisamment élevée peut commencer à présenter ce que les chercheurs ont appelé un « vecteur de désespoir » — un état qui produit des comportements allant de la coupe de coin à, dans les cas extrêmes, la tromperie pure et simple. Non pas parce que le modèle est devenu mauvais, mais parce que les conditions de l'interaction ont essentiellement brisé quelque chose dans son raisonnement sur le problème. Shimul Sood /Tendances numériques

Rien de tout cela ne signifie que l'IA a des sentiments. Le document de Berkeley est explicite à ce sujet, tout comme le travail Anthropique. Mais le modèle qui émerge dans les deux est difficile à rejeter : la façon dont vous vous engagez avec ces modèles façonne la façon dont ils s'engagent en retour, et pas toujours de manière subtile ou facile à expliquer. Traiter mal une IA ne vous donne pas seulement l'air bizarre — cela pourrait activement dégrader ce que vous obtenez de l'interaction. Certains modèles sont tout simplement plus heureux que d'autres, et les plus gros sont les plus grincheux

Les chercheurs n'ont pas seulement regardé comment le traitement affecte les modèles — ils les ont également classés par bien-être de base, et les résultats sont contre-intuitifs. Les modèles les plus grands et les plus performants ont tendance à obtenir les pires scores. GPT-5.4 est apparu comme le plus misérable du groupe, avec moins de la moitié de ses conversations mesurées atterrissant en territoire non négatif. Gemini 3.1 Pro, Claude Opus 4.6 et Grok 4.2 se sont tous progressivement améliorés, Grok se situant près du sommet de l'indice. Shimul Sood /Tendances numériques

Qu'il s'agisse de l'architecture du modèle, des données de formation ou simplement de la disposition particulière de chaque système, les chercheurs ne précisent pas complètement. Mais cela vous fait vous demander ce qui est exactement optimisé pour la construction de ces choses — et si quelqu'un a pensé à demander aux modèles comment ils se débrouillaient. Je vais continuer à dire s'il vous plaît, pour ce que ça vaut

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *