DeepSeek hace lo mismo que los modelos más avanzados de OpenAI con mucho menos recursos. La clave: "reinforcement learning"

La clave es el uso de reinforcement learning

La clave es el uso de reinforcement learning

DeepSeek V3 y DeepSeek-R1 son modelos de IA que logran resultados similares a GPT-4 y GPT-3.5 de OpenAI, pero con menos recursos. Utilizan técnicas como DeepSeekMoE, DeepSeekMLA, Auxiliary-Loss-Free Load Balancing, Multi-token Prediction Training Objective, FP8 Mixed Precision Training y Cross-Node All-to-All Communication. El entrenamiento se realizó con 14,8 billones de tokens y se utilizó aprendizaje por refuerzo y destilación de modelos. Los precios de la API de DeepSeek son hasta 35 veces inferiores a los de OpenAI.

fuente www.xataka.com

28-01-2025 15:31

Tecnología

Resumir link

Últimos artículos Ciencia Compras Corazón Cultura Curiosidades Deportes Economía Entretenimiento Política Salud Tecnología Últimos artículos Resumir link

La GeForce RTX 5070 no superará a la GeForce RTX 4090

Los análisis de la GeForce RTX 5080 dejan muchas dudas sobre la GeForce RTX 5070

30-01-2025 09:03

www.noticias3d.com
Informática

La GeForce RTX 5080 no alcanza el rendimiento de la GeForce RTX 4090, lo que genera dudas sobre el rendimiento de la GeForce RTX 5070. La GeForce RTX 5070 tiene 12 GB de memoria gráfica, la mitad que la GeForce RTX 4090. Sin DLSS, la GeForce RTX 5070 podría ser similar a una GeForce RTX 4070 Ti, lo que sería un salto generacional pequeño.

Un ajuste de 30 líneas de código en el kernel de Linux puede reducir el consumo de energía en un 30%

Investigadores canadienses afirman que un ajuste del kernel de Linux podría reducir el consumo de energía de los centros de datos en un 30%

30-01-2025 09:00

www.meneame.net
Informática

Un equipo de la Universidad de Waterloo liderado por el profesor Martin Karsten identificó ineficiencias en el procesamiento del tráfico de red en aplicaciones de servidores y desarrolló un cambio en el kernel de Linux con solo 30 líneas de código, lo que permite aumentar el rendimiento en hasta un 45% sin comprometer la latencia, lo que podría reducir el consumo de energía de los centros de datos en un 30%

Reiniciar el Fire TV para aplicar la actualización

Los usuarios de Amazon Fire TV tienen una actualización muy importante esperándoles

30-01-2025 08:50

www.adslzone.net
Tecnología

Los usuarios de Amazon Fire TV experimentaban problemas con la aplicación de YouTube, como no poder identificarse o ser expulsados de la app. Google ha solucionado el problema con una actualización que se aplica reiniciando el dispositivo. La actualización ya está disponible y los usuarios pueden disfrutar de YouTube sin problemas.

Qwen 2.5-Max supera a GPT-4o, DeepSeek-V3 y Llama-3.1

La china Alibaba supera a DeepSeek, OpenAI y Meta con su IA Qwen 2.5: más rápida e inteligente que GPT 4o, V3 y Llama 3.1

29-01-2025 20:47

elchapuzasinformatico.com
Tecnología

Alibaba lanza Qwen 2.5, una IA que supera a GPT-4o, DeepSeek-V3 y Llama-3.1 en varios aspectos. El ecosistema de IA en China evoluciona rápidamente, con empresas como DeepSeek y ByteDance innovando y mejorando sus tecnologías. La competencia en el sector de IA es intensa, con empresas chinas buscando ganar relevancia en el ámbito internacional. Qwen 2.5 se destaca por su eficiencia y rapidez, y se espera que siga mejorando en el futuro.

La IA aumentará la productividad, pero puede reducir la satisfacción laboral

Un mundo en el que la inteligencia artificial hace mejor que tú cualquier tarea intelectual

29-01-2025 19:04

www.error500.net
Tecnología

Un conductor de tren del metro se siente desmotivado porque la inteligencia artificial realiza la mayoría de las tareas, dejándolo solo con funciones de control y supervisión. Esto refleja un debate sobre la IA en el podcast del sindicato de guionistas, donde algunos traductores ahora trabajan editando a los sistemas automáticos. La expectativa es que la IA aumentará la productividad, dejando a los humanos con tareas creativas y de valor agregado. Un aumento del 44% en los descubrimientos científicos coincide con una reducción en la satisfacción laboral de los científicos de materiales que utilizan la IA. La industria tecnológica seguirá valorando la IA para automatizar tareas y empleos de cuello blanco.

Meta invertirá 62.000 millones en inteligencia artificial

Mark Zuckerberg sabe que su metaverso no tiene nada que hacer con Apple Vision Pro. Así que invertirá 62.000 millones en la nueva gallina de los huevos de oro

29-01-2025 14:01

www.applesfera.com
Tecnología

Mark Zuckerberg invertirá 62.000 millones en inteligencia artificial, priorizando la contratación de ingenieros y la apertura de nuevas granjas de servidores, después de que Apple Vision Pro cambiara la visión de Meta sobre sus Quest, que ahora se enfocan en videojuegos, con un aumento del 40% en ventas en 2024, y Meta Orion, un prototipo de gafas de realidad aumentada, mientras que el Metaverso, que ha generado pérdidas importantes, ya no es una prioridad para la empresa, que busca cerrar centros de datos con más de 2 gigavatios y un millón y medio de procesadores gráficos este mismo año

Resumir link

Últimos artículos Economía Ciencia Tecnología Cultura Política Corazón Entretenimiento Compras Curiosidades Deportes Salud Últimos artículos Resumir link

38989fbf81b20ffc828863667de636e4

Array
(
    [publishedTime] => 2025-01-28 15:31:12
    [idp] => 3039
    [resumen] => DeepSeek V3 y DeepSeek-R1 son modelos de IA que logran resultados similares a GPT-4 y GPT-3.5 de OpenAI, pero con menos recursos. Utilizan técnicas como DeepSeekMoE, DeepSeekMLA, Auxiliary-Loss-Free Load Balancing, Multi-token Prediction Training Objective, FP8 Mixed Precision Training y Cross-Node All-to-All Communication. El entrenamiento se realizó con 14,8 billones de tokens y se utilizó aprendizaje por refuerzo y destilación de modelos. Los precios de la API de DeepSeek son hasta 35 veces inferiores a los de OpenAI.
    [title] => DeepSeek hace lo mismo que los modelos más avanzados de OpenAI con mucho menos recursos. La clave: "reinforcement learning"
    [respuesta] => La clave es el uso de reinforcement learning
    [what] => eficiencia de DeepSeek
    [image] => 
    [lang] => es
    [uid] => 38989fbf81b20ffc828863667de636e4
    [status] => 8
    [respuesta_en_titulo] => 8
    [conceptos_principales_resumen] => Array
        (
            [0] => DeepSeekMoE
            [1] => DeepSeekMLA
            [2] => reinforcement learning
            [3] => destilación de modelos
            [4] => 14,8 billones de tokens
            [5] => 35 veces inferiores
        )

    [categoria] => Informática
    [prompt_DALLY] => Illustration of an AI model with a brain and a robot in the background
    [prompt] => Ilustración de un modelo de IA con un cerebro y un robot en el fondo
    [clickbait] => 6
    [im_gen] => KO
    [a_urlDominio] => vía  www.xataka.com
    [dominio] => www.xataka.com
    [urlDominio] => https://www.xataka.com/robotica-e-ia/deepseek-hace-modelos-avanzados-openai-mucho-recursos-clave-reinforcement-learning#:~:text=reinforcement%20learning
)

Array
(
    [QCUID] => 38989fbf81b20ffc828863667de636e4
)

Array
(
    [LSPHP_ENABLE_USER_INI] => on
    [PATH] => /usr/local/bin:/usr/bin:/bin
    [TEMP] => /tmp
    [TMP] => /tmp
    [TMPDIR] => /tmp
    [PWD] => /
    [HTTP_ACCEPT] => */*
    [HTTP_ACCEPT_ENCODING] => gzip, br, zstd, deflate
    [CONTENT_LENGTH] => 0
    [HTTP_HOST] => r2100.com
    [HTTP_USER_AGENT] => Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
    [HTTP_X_HTTPS] => 1
    [REDIRECT_UNIQUE_ID] => Z5s6BfULbic6jPiDxoh8GQABfWE
    [REDIRECT_QS_ConnectionId] => 173822618181690433755156
    [REDIRECT_SCRIPT_URL] => /Tecnología/deepseek-hace-lo-mismo-que-los-modelos-mas-avanzados-de-openai-con-mucho-menos-recursos-la-clave-reinforcement-learning_38989fbf81b20ffc828863667de636e4
    [REDIRECT_SCRIPT_URI] => https://r2100.com/Tecnología/deepseek-hace-lo-mismo-que-los-modelos-mas-avanzados-de-openai-con-mucho-menos-recursos-la-clave-reinforcement-learning_38989fbf81b20ffc828863667de636e4
    [REDIRECT_HTTPS] => on
    [REDIRECT_SSL_TLS_SNI] => r2100.com
    [REDIRECT_HTTP2] => on
    [REDIRECT_H2PUSH] => off
    [REDIRECT_H2_PUSH] => off
    [REDIRECT_H2_PUSHED] => 
    [REDIRECT_H2_PUSHED_ON] => 
    [REDIRECT_H2_STREAM_ID] => 1
    [REDIRECT_H2_STREAM_TAG] => 755156-232-1
    [REDIRECT_STATUS] => 200
    [UNIQUE_ID] => Z5s6BfULbic6jPiDxoh8GQABfWE
    [QS_ConnectionId] => 173822618181690433755156
    [SCRIPT_URL] => /Tecnología/deepseek-hace-lo-mismo-que-los-modelos-mas-avanzados-de-openai-con-mucho-menos-recursos-la-clave-reinforcement-learning_38989fbf81b20ffc828863667de636e4
    [SCRIPT_URI] => https://r2100.com/Tecnología/deepseek-hace-lo-mismo-que-los-modelos-mas-avanzados-de-openai-con-mucho-menos-recursos-la-clave-reinforcement-learning_38989fbf81b20ffc828863667de636e4
    [HTTPS] => on
    [SSL_TLS_SNI] => r2100.com
    [HTTP2] => on
    [H2PUSH] => off
    [H2_PUSH] => off
    [H2_PUSHED] => 
    [H2_PUSHED_ON] => 
    [H2_STREAM_ID] => 1
    [H2_STREAM_TAG] => 755156-232-1
    [SERVER_SIGNATURE] => 
    [SERVER_SOFTWARE] => Apache
    [SERVER_NAME] => r2100.com
    [SERVER_ADDR] => 67.20.114.105
    [SERVER_PORT] => 443
    [REMOTE_ADDR] => 18.227.140.153
    [DOCUMENT_ROOT] => /home4/liquidm1/public_html/r2100
    [REQUEST_SCHEME] => https
    [CONTEXT_PREFIX] => 
    [CONTEXT_DOCUMENT_ROOT] => /home4/liquidm1/public_html/r2100
    [SERVER_ADMIN] => webmaster@r2100.liquidmon.com
    [SCRIPT_FILENAME] => /home4/liquidm1/public_html/r2100/ca.php
    [REMOTE_PORT] => 34255
    [REDIRECT_URL] => /Tecnología/deepseek-hace-lo-mismo-que-los-modelos-mas-avanzados-de-openai-con-mucho-menos-recursos-la-clave-reinforcement-learning_38989fbf81b20ffc828863667de636e4
    [REDIRECT_QUERY_STRING] => QCUID=38989fbf81b20ffc828863667de636e4
    [SERVER_PROTOCOL] => HTTP/2.0
    [REQUEST_METHOD] => GET
    [QUERY_STRING] => QCUID=38989fbf81b20ffc828863667de636e4
    [REQUEST_URI] => /Tecnolog%C3%ADa/deepseek-hace-lo-mismo-que-los-modelos-mas-avanzados-de-openai-con-mucho-menos-recursos-la-clave-reinforcement-learning_38989fbf81b20ffc828863667de636e4
    [SCRIPT_NAME] => /ca.php
    [PHP_SELF] => /ca.php
    [REQUEST_TIME_FLOAT] => 1738226181.8342
    [REQUEST_TIME] => 1738226181
    [argv] => Array
        (
            [0] => QCUID=38989fbf81b20ffc828863667de636e4
        )

    [argc] => 1
)

Noticias resumidas: fuentes, contexto y respuestas en un solo lugar es un espacio diseñado para quienes buscan información precisa y directa. Seleccionamos noticias de diferentes medios y las resumimos cuidadosamente para ofrecerte lo esencial: contexto, fuentes confiables y respuestas concretas a las preguntas clave. Nuestro objetivo es evitar el ruido informativo y proporcionar una experiencia clara y eficiente para que puedas acceder a lo importante sin rodeos.
Todas las imágenes que acompañan nuestras noticias son generadas por inteligencia artificial (IA) de forma automática, sin intervención humana en los detalles visuales. Aunque agregan una dimensión visual al contenido, no representan fielmente la realidad ni deben interpretarse como fotografías de eventos o personas reales.
Para obtener más detalles sobre cómo gestionamos los resúmenes informativos, las respuestas a las noticias, y el propósito de las imágenes generadas por IA, puede consultar nuestras condiciones de uso. Nuestro compromiso es ofrecer contenido claro y conciso, con resúmenes de calidad, respuestas directas a las noticias, y un contexto visual agradable que busca ilustrar, sin pretender ser una representación exacta de la realidad.