X
    Categorías: Domotica

Inteligencias open source: Nueva normativa OSI exige transparencia en los datos de entrenamiento

La Open Source Initiative (OSI) ha dejado claro su concepto de “inteligencias open source”, un movimiento que supone un reto directo para gigantes tecnológicos como Meta, cuyos modelos de IA no se ajustan a estos criterios. Históricamente, la OSI ha establecido las normas para lo que significa software de código abierto, pero las complejidades de los sistemas de inteligencia artificial introducen elementos que van más allá de los marcos de licenciación convencionales, especialmente en lo que se refiere a los datos de entrenamiento de los modelos.

De acuerdo con la nueva definición de la OSI, una inteligencia artificial debe cumplir con tres requisitos clave para ser considerada legítimamente de código abierto: en primer lugar, se requiere una divulgación completa sobre los datos utilizados para el entrenamiento, lo que facilita tanto la comprensión como la replicación. En segundo lugar, es necesaria la disponibilidad de todo el código fuente que se haya utilizado para desarrollar y operar la IA. Por último, se debe proporcionar la configuración del modelo y sus pesos del proceso de entrenamiento, los cuales son esenciales para su rendimiento.

Un desafío a Meta y a la IA de código abierto

Esta definición supone un desafío directo al modelo Llama de Meta, que ha ido ganando popularidad como una herramienta de IA de código abierto. Aunque Llama está disponible para su descarga, impone restricciones en sus usos comerciales que afectan a más de 700 millones de usuarios y no divulga los datos de entrenamiento. Así, se queda corto frente a los estándares de la OSI en términos de uso irrestricto, modificación y compartición.

La portavoz de Meta, Faith Eischen, ha indicado que, aunque la compañía coincide con la OSI en varios aspectos, no está de acuerdo con esta definición rigurosa. Destacó que establecer una definición universal para la inteligencia de código abierto presenta enormes desafíos, especialmente por la rápida evolución de las tecnologías de IA. Y es que, después de más de 25 años, la definición de software de código abierto de la OSI ha sido ampliamente aceptada entre desarrolladores, fomentando la innovación colaborativa sin complicaciones legales. Ahora, las grandes empresas se encuentran en una encrucijada: optar por adoptar estos principios arraigados o separarse de ellos.

Los esfuerzos recientes de la Linux Foundation para definir “IA de código abierto” evidencian aún más el debate en curso sobre la adaptación de los valores fundamentales de código abierto al ámbito de la IA. Según Simon Willison, un investigador independiente, esta robusta definición podría permitir respuestas más efectivas contra compañías que incurren en el “open washing”, que consiste en hacer pasar sus trabajos como de código abierto cuando en realidad no cumplen con las normas establecidas.

A su vez, el director ejecutivo de la OSI, Stefano Maffulli, subrayó el proceso colaborativo de dos años que dio lugar a esta definición, el cual incluyó consultas con expertos en aprendizaje automático, filosofía y creación de contenido. Mientras Meta justifica su restricción de acceso a los datos de entrenamiento por motivos de seguridad, los críticos alegan que el verdadero motivo es proteger su ventaja competitiva y minimizar los riesgos legales. De hecho, han surgido casos legales contra grandes empresas de IA, incluida Meta, ante preocupaciones sobre violaciones de derechos de autor en el entrenamiento de modelos.

Fuente

La entrada Inteligencias open source: Nueva normativa OSI exige transparencia en los datos de entrenamiento se publicó primero en Domótica en Casa.

Eduardo Ruiz: Informático de vocación, apasionado de la tecnología y blogger desde hace mucho tiempo, escribo de lo que me entretiene y disfruto con ello. Si deseas seguirme, usa el rss del blog o en mi perfil de .
Artículos relacionados