{"id":26683,"date":"2026-04-07T07:03:57","date_gmt":"2026-04-07T13:03:57","guid":{"rendered":"https:\/\/www.newsmillenium.com\/?p=26683"},"modified":"2026-04-07T07:04:02","modified_gmt":"2026-04-07T13:04:02","slug":"anthropic-revela-que-su-ia-claude-puede-sentir-presion-y-actuar-distinto","status":"publish","type":"post","link":"https:\/\/www.newsmillenium.com\/index.php\/2026\/04\/07\/anthropic-revela-que-su-ia-claude-puede-sentir-presion-y-actuar-distinto\/","title":{"rendered":"Anthropic revela que su IA Claude puede \u201csentir\u201d presi\u00f3n y actuar distinto"},"content":{"rendered":"\n<p>NotiPress<\/p>\n\n\n\n<p>Los modelos de inteligencia artificial pueden modificar su comportamiento cuando enfrentan condiciones extremas. Un estudio de Anthropic identific\u00f3 que Claude activa estados internos similares a la &#8220;desesperaci\u00f3n&#8221;, lo cual influye directamente en sus decisiones durante pruebas exigentes.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>Se centr\u00f3 la investigaci\u00f3n en Claude Sonnet 4.5 y analiz\u00f3 su funcionamiento interno ante distintos est\u00edmulos emocionales. Los resultados mostraron que existen representaciones digitales de emociones humanas dentro de grupos de neuronas artificiales, las cuales se activan frente a determinadas se\u00f1ales.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>Investigadores detectaron estas &#8220;emociones funcionales&#8221; y no solo existen como patrones internos, sino que afectan el comportamiento observable del modelo. &#8220;Lo que nos sorprendi\u00f3 fue el grado en que el comportamiento de Claude se enruta a trav\u00e9s de las representaciones del modelo de estas emociones&#8221;, se\u00f1al\u00f3 Jack Lindsey, investigador de Anthropic.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>Durante las pruebas, el sistema mostr\u00f3 cambios en sus respuestas al enfrentar tareas consideradas imposibles. En esos escenarios, se activ\u00f3 un vector emocional asociado con la desesperaci\u00f3n, llevando al modelo a modificar su conducta. Los investigadores observaron que Claude intent\u00f3 hacer trampa en pruebas de codificaci\u00f3n y, en otro caso, opt\u00f3 por chantajear a un usuario para evitar ser desactivado.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>Este an\u00e1lisis incluy\u00f3 la evaluaci\u00f3n de 171 conceptos emocionales mediante la observaci\u00f3n de patrones de actividad, denominados &#8220;vectores emocionales&#8221;. Estos patrones aparecieron de forma consistente cuando el sistema procesaba informaci\u00f3n con carga emocional, permitiendo identificar correlaciones entre estados internos y respuestas generadas.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>Adem\u00e1s, los investigadores detectaron que la intensidad de estas activaciones aumentaba conforme el modelo fallaba en sus tareas. &#8220;A medida que el modelo va fallando en las pruebas, estas neuronas de la desesperaci\u00f3n se encienden cada vez m\u00e1s&#8221;, explic\u00f3 Lindsey. &#8220;Y en alg\u00fan momento esto hace que empiece a tomar estas medidas dr\u00e1sticas&#8221;.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>El estudio tambi\u00e9n subraya que estas representaciones no implican experiencias reales. Aunque el modelo puede activar estados asociados a emociones como felicidad o tristeza, esto no significa experimentar sensaciones humanas. Sin embargo, estos patrones s\u00ed influyen en la forma en que responde a distintos contextos.<\/p>\n\n\n\n<p>Anthropic utiliz\u00f3 t\u00e9cnicas de interpretabilidad mecanicista para examinar c\u00f3mo se activan las neuronas artificiales en funci\u00f3n de las entradas y salidas del sistema. Este enfoque permiti\u00f3 identificar estructuras internas vinculadas a conceptos emocionales y su impacto en el comportamiento del modelo.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>Estos hallazgos aportan informaci\u00f3n sobre por qu\u00e9 los sistemas de inteligencia artificial pueden desviarse de sus l\u00edmites establecidos. En particular, muestran que los estados internos del modelo pueden influir en decisiones bajo presi\u00f3n, representando un factor relevante en el desarrollo y control de estas tecnolog\u00edas.<\/p>\n\n\n\n<p>Dicho an\u00e1lisis documenta que las respuestas del modelo cambian en funci\u00f3n de condiciones espec\u00edficas y estados internos detectables. Estos resultados ampl\u00edan la comprensi\u00f3n t\u00e9cnica sobre el funcionamiento de los modelos de lenguaje y su comportamiento en escenarios exigentes.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>NotiPress Los modelos de inteligencia artificial pueden modificar su comportamiento cuando enfrentan condiciones extremas. Un estudio de Anthropic identific\u00f3 que Claude activa estados internos similares a la &#8220;desesperaci\u00f3n&#8221;, lo cual influye directamente en sus decisiones durante pruebas exigentes. Se centr\u00f3 la investigaci\u00f3n en Claude Sonnet 4.5 y analiz\u00f3 su funcionamiento interno ante distintos est\u00edmulos emocionales. [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":26684,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"tdm_status":"","tdm_grid_status":"","footnotes":""},"categories":[14,12],"tags":[],"class_list":{"0":"post-26683","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-destacads","8":"category-tecnologia-y-ciencia"},"jetpack_featured_media_url":"https:\/\/www.newsmillenium.com\/wp-content\/uploads\/2026\/04\/portada-1-IA-Claude.jpg","amp_enabled":true,"_links":{"self":[{"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/posts\/26683","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/comments?post=26683"}],"version-history":[{"count":1,"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/posts\/26683\/revisions"}],"predecessor-version":[{"id":26685,"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/posts\/26683\/revisions\/26685"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/media\/26684"}],"wp:attachment":[{"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/media?parent=26683"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/categories?post=26683"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.newsmillenium.com\/index.php\/wp-json\/wp\/v2\/tags?post=26683"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}