Mientras mantiene una demanda abierta contra OpenAI y Microsoft por el uso de su contenido para entrenar los modelos grandes de lenguaje (LLM) de ambas compañías, The New York Times se ha referido a otra compañía de inteligencia artificial (IA) generativa para exigirle que deje de entrenar sus modelos con su contenido periodístico.
Lo ha hecho a través de una carta publicada en The Wall Street Journal, donde ha señalado que “Perplexity y sus partners de negocio han estado enriqueciéndose injustamente por usar, sin autorización, el periodismo editado, cuidadosamente escrito e investigado del Times sin una licencia”.
Y ello a pesar de que el editor había empleado el documento robots.txt para impedir que los rastreadores de aplicaciones de IA generativa extraigan información de su web para entrenar sus modelos.
Desde Perplexity han querido aclarar que la compañía no está utilizando el contenido publicado por The New York Times para entrenar sus modelos de IA generativa, ya que la compañía no se dedica a extraer datos para dicha tarea, “sino que indexamos páginas web y contenido objetivo como citas para informar en las respuestas que se dan al usuario cuando lanza una pregunta”, según exponen en el comunicado compartido al que ha tenido acceso el diario tecnológico The Verge.
“La ley reconoce que ninguna organización es propietaria del copyright de los hechos. Esto nos permite tener un ecosistema de información abierto y rico y da a las organizaciones de noticias la capacidad de informar de temas que previamente habían sido cubiertas por otra organización”, añaden.
Aún así, el New York Times no es el único medio que ha acusado a Perplexity de plagio – a comienzos de año lo hizo Forbes y Condé Nast-, y ha cerrado varios acuerdos con publishers para poder indexar sus contenidos a cambio de percibir estos últimos ingresos publicitarios y suscripciones gratuitas a partners como Fortune, Time y The Texas Tribune.