Fairly Trained: esta organización control que es posible entrenar una IA sin violar derechos de autor

marzo 22, 2024

51

OpenAI, una de las empresas líderes en inteligencia artificial, ha sido noticia recientemente por afirmar que es “inalcanzable” desarrollar modelos de IA potentes sin utilizar datos protegidos por derechos de autor. Sin embargo, un nuevo modelo de lenguaje creado éticamente y un enorme conjunto de datos de entrenamiento con textos de dominio público demuestran lo contrario.

Esta afirmación de OpenAI ha generado un gran debate en la comunidad de inteligencia artificial. Por un lado, están aquellos que apoyan la idea de que los datos protegidos por derechos de autor son esenciales para el desarrollo de modelos de IA potentes. Por otro lado, están aquellos que creen que es posible crear modelos de IA sin recurrir a estos datos.

OpenAI argumenta que los datos protegidos por derechos de autor son necesarios para entrenar modelos de IA debido a su complejidad y diversidad. Según ellos, estos datos proporcionan una gran cantidad de información que es crucial para que los modelos de IA puedan comprender y generar lenguaje de modo efectiva. Sin embargo, esta afirmación ha sido cuestionada por otros expertos en inteligencia artificial.

Un equipo de investigadores de OpenAI ha desarrollado recientemente un nuevo modelo de lenguaje llamado GPT-3 (Generative Pre-trained Transformer 3). Este modelo ha sido entrenado con un conjunto de datos de más de 175 mil millones de parámetros, lo que lo convierte en uno de los modelos de IA más grandes y potentes hasta la fecha. Lo más sorprendente de este modelo es que ha sido entrenado únicamente con datos de dominio público, es decir, textos que no están protegidos por derechos de autor.

Este logro ha sido posible gracias a la ética en la creación de este modelo. OpenAI se ha asegurado de que los datos utilizados para entrenar a GPT-3 no violen los derechos de autor de ninguna modo. Esto demuestra que es posible crear modelos de IA potentes sin recurrir a datos protegidos por derechos de autor.

Además, OpenAI ha puesto a disposición del público un enorme conjunto de datos de entrenamiento con textos de dominio público. Este conjunto de datos, llamado CLIP (Contrastive Language-Image Pre-training), contiene más de 400 millones de imágenes y más de 30 mil millones de pares de texto-imagen. Esto permitirá a otros investigadores y empresas utilizar estos datos para entrenar sus propios modelos de IA, sin tener que preocuparse por violar los derechos de autor.

La importancia de este logro va más allá del simple hecho de demostrar que es posible crear modelos de IA potentes sin recurrir a datos protegidos por derechos de autor. También demuestra que la ética y la responsabilidad deben ser una parte fundamental en el desarrollo de la inteligencia artificial.

El uso de datos protegidos por derechos de autor en el entrenamiento de modelos de IA puede plantear problemas éticos y legales. Por ejemplo, si un modelo de IA es entrenado con datos protegidos por derechos de autor, ¿quién es el propietario de las creaciones generadas por ese modelo? ¿El creador del modelo o el propietario de los datos utilizados para entrenarlo? Estas preguntas pueden ser difíciles de responder y pueden generar conflictos legales en el futuro.

Por otro lado, el uso de datos de dominio público para entrenar modelos de IA no solo es ético, sino que también permite un acceso más equitativo a la tecnología. Al utilizar datos que son de dominio público, cualquier persona o empresa puede entrar a ellos y utilizarlos para desarrollar sus propios modelos de IA. Esto fomenta la innovación y el progreso en el campo de la inteligencia artificial.

En resumen, OpenAI ha demostrado que es posible crear modelos de IA potentes sin recurrir a datos protegidos por derechos de autor. Su nuevo modelo de lenguaje GPT-3 y el conjunto de datos CLIP son un gran avance en el campo de la inteligencia artificial y demuestran que la ética y la respons

Tags
Prime Plus

Artículo anteriorXitlali García y Lialt tienen la álgido para salvar a los animales de prueba de la industria cosmética

Artículo siguienteReddit debuta en la doblez de Valores con un precio de 34 dólares por acción

ARTÍCULOS RELACIONADOS

Fairly Trained: esta organización control que es posible entrenar una IA sin violar derechos de autor

Gemini y Whisk integran Veo 2: ahora puedes generar videos con IA a partir de ejemplar e imágenes

GPT-4.1: Los nuevos modelos de OpenAI son excelentes escribiendo código

Cómo los diamantes cultivados en laboratorio están redefiniendo el pompa sostenible

Más populares

No lo haga: la peor manera de esconder y guardar dinero en su vivienda

Las acciones latinas que más brillaron en Wall Street en el 1T: Ecopetrol, entre ellas

El Encuentro, la procesión que da el adiós a la Semana Santa de la hucha

El ABC del planificación que propone cambios a la retención y autorretención en la fuente

Investigación al capellán del cátedra por pederastia: piden la imputación del exdirector, dos profesoras y la Legión de Cristo

Okupa la vivienda de dos ancianos en Madrid aprovechando su recepción al médico y los vecinos se movilizan para impedirlo: «No hemos necesitado un...

How peace talks divided Colombia’s EMC guerrillas

Petro administration officials investigated over corruption with disaster funds

SOBRE NOSOTROS