La inteligencia artificial se ha convertido en una herramienta esencial para muchos usuarios y empresas, sobre todo, para hacer tareas de forma rápida y eficaz. Sin embargo, un estudio reciente ha revelado que estos sistemas no son tan fiables como parece.
El análisis realizado por el Tow Center for Digital Journalism de la Columbia Journalism Review ha evaluado la precisión de 8 motores de búsqueda basados en IA y han encontrado resultados preocupantes: más del 60% de los resultados que ofrecen estos chatbots son incorrectos.
La metodología usada para este estudio, consistió en seleccionar diez artículos de veinte editores diferentes y extraer fragmentos de texto de cada uno. Posteriormente, se realizaron un total de 1.600 consultas a los 8 chatbots, entre los cuales estaban: ChatGPT, Perplexity, Perplexity Pro, Copilot, Gemini, DeepSeek, Grok 2 y Grok 3. Tras estas consultas, los resultados fueron categorizados en cinco niveles de precisión según las respuestas que ofrecían los chatbots: completamente correctos, correctos pero incompletos, parcialmente incorrectos, completamente incorrectos y no proporcionados.
El estudio genera resultados preocupantes
Entre los resultados obtenidos, destaca que el chatbot de Perplexity fallo en un 37% de sus respuestas, mientras que Grok 3, presento una sorprendente tasa de error del 94%. Pero el hecho más curioso es que los chatbots premium, que requieren un pago mensual o anual, tendieron a ofrecer respuestas incorrectas con mayor seguridad que los modelos gratuitos. Este hecho afirmado que a pesar de su coste, no garantiza una respuesta con mayor precisión.
Otro aspecto verdaderamente preocupante para los editores web, es la tendencia de estos chatbots a eludir las directrices establecidas por el protocolo de exclusión de robots (robots.txt), que permite a los editores bloquear rastreadores automáticos. Por ejemplo, el chatbot de Perplexity, que destaca por su habilidad al mencionar las fuentes consultadas, accedió y ofreció información de artículos de National Geographic, a pesar de que estos habían restringido el rastreador web.
Perplexity también ofrece información de artículos exclusivamente reservados a suscriptores de pago, con solo proporcionarle el titular del artículo. Por último, también se detectaron enlaces rotos o incorrectos, los cuales no llevaban a la fuente original de la información.
DeepSeek también tiene problemas de fiabilidad
En el ámbito de la seguridad, DeepSeek, ha sido objeto de escrutinio debido a múltiples vulnerabilidades críticas. Un informe de NowSecure reveló que la aplicación de DeepSeek transmitía datos sensibles sin cifrar y desactivaba las protecciones de seguridad recomendadas por Apple, exponiendo la información de los usuarios a posibles interceptaciones. Además, se descubrió que los datos recopilados se enviaban a servidores controlados por ByteDance, la empresa matriz de TikTok, lo que generó preocupaciones sobre la privacidad y la seguridad nacional.
Estos hallazgos ponen de manifiesto la necesidad de abordar las limitaciones actuales de los chatbots de IA. Aunque representan avances muy importantes en la tecnología, es esencial que las empresas y los desarrolladores implementen medidas para mejorar la precisión de las respuestas y garantizar la seguridad de los datos de los usuarios.
Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.