Google ha cambiado la política de privacidad para entrenar la IA con datos públicos. ¿Todo está bien?

Google ha cambiado la política de privacidad para entrenar la IA con datos públicos. ¿Todo está bien?

La política de privacidad actualizada de Google dice que puede usar datos públicos para entrenar sus modelos de IA, es decir, mejorar productos como las características de Bard y Cloud AI. Hechos y percepciones

A partir de ahora sus búsquedas en Google, y no solo, podrían hacer que un bot de inteligencia artificial sea más "inteligente".

El gigante tecnológico de Mountain View actualizó su política de privacidad el 1 de julio para decir que puede usar datos disponibles públicamente para ayudar a entrenar sus modelos de IA.

En concreto, en la formulación de su política, Google ha sustituido los “modelos de IA” por “modelos de lenguaje”. También dijo que podría usar la información disponible públicamente para crear no solo funciones, sino productos completos como "Google Translate, Bard [la respuesta de Big G al chatbot de OpenAI] y las capacidades de Cloud AI". Entonces, Google dice que eliminará todo lo que publique en línea para la IA.

“Si Google puede leer tus palabras, asume que ahora pertenecen a la empresa y espera que estén al acecho en algún lugar de las entrañas de un chatbot”, señalaGizmodo . El movimiento reciente plantea preguntas y preocupaciones sobre problemas de privacidad de datos de los reguladores, propietarios de sitios web y otros.

Basta pensar en las acusaciones realizadas recientemente contra OpenAI, la empresa que desarrolló el popular software de inteligencia artificial ChatGpt, y contenidas en una demanda colectiva presentada por California que podría cambiar el desarrollo de este software en el que está involucrado todo Silicon Valley. En Italia la plataforma estuvo suspendida durante un mes, hasta finales de abril, tras las conclusiones del Privacy Guarantor, mientras que hace unos días Europa aprobó la AI Act, la propuesta para regular la inteligencia artificial.

Sin olvidar que el web scraping a favor del entrenamiento en IA ha llamado la atención de Elon Musk en Twitter , pero también de otra popular plataforma como es Reddit.

Todos los detalles.

CAMBIOS EN LA POLÍTICA DE PRIVACIDAD DE GOOGLE CON RESPECTO A LA IA

A partir del 1 de julio, la política modificada recientemente del gigante tecnológico dice: “Google utiliza la información para mejorar nuestros servicios y desarrollar nuevos productos, características y tecnologías para el beneficio de nuestros usuarios y el público. Por ejemplo, usamos información disponible públicamente para ayudar a entrenar modelos de IA de Google y crear productos y funciones como Google Translate, Bard y capacidades de IA en la nube”.

Anteriormente, la política solo establecía que la información disponible públicamente podría usarse para ayudar a entrenar los "modelos de lenguaje" de Google y proporcionaba solo una mención de Google Translate, señala Mashable .

COMENTARIOS DE EXPERTOS

“Esta es una cláusula inusual para una política de privacidad. Por lo general, estas políticas describen las formas en que una empresa utiliza la información que publica sobre los servicios de la empresa. Aquí, parece que Google se reserva el derecho de recopilar y explotar los datos publicados en cualquier lugar de la web pública, como si todo Internet fuera el campo de juego de la IA de la empresa”, señalaGizmodo .

En Italia, el experto en tecnología Matteo Flora, en su canal de YouTube “Ciao Internet”, afirmó que “en la práctica, el cambio en la política de privacidad de Google impacta bastante porque te dice cómo se usarán esos datos, que hasta ahora no eran”. No se utiliza para ese propósito: para entrenar sistemas de IA. Lo que deja abierta una serie de problemas -que son los mismos con los que se topó OpenAi, nada en particular- pero en mi opinión tienen mucha más repercusión".

Primero, según Flora, surge un problema de derechos de autor: "Aunque la política actual dice que solo se usará la información disponible públicamente, no especifica cómo pretende Google evitar que el material con derechos de autor termine en este sistema de capacitación".

Además, prosigue el experto Matteo Flora, "no solo los números de teléfono, los datos personales, las biografías de las personas entran dentro del RGPD, la legislación europea sobre privacidad, que declara que se debe solicitar el consentimiento para los datos personales y de ninguna parte de la nueva política de privacidad de Google". habla de este consentimiento. En la práctica, basta con que cualquier contenido esté disponible públicamente para formar parte del entrenamiento de IA de Google, y por tanto en la posibilidad de que Google monetice este tipo de contenido”.

CONTRAMOVIMIENTOS DE TWITTER Y REDDIT

Incluso los propietarios de sitios web que podrían considerarse plazas públicas en la era digital han tomado medidas para prevenir o beneficiarse del auge de la IA generativa.

En los últimos días, tanto Twitter, la plataforma de microblogging propiedad de Elon Musk, como Reddit han desactivado el acceso gratuito a sus API, que anteriormente permitía a cualquiera que lo deseara descargar grandes cantidades de publicaciones. Además, el 1 de julio, Twitter limitó temporalmente la lectura de tuits para contener el uso de datos disponibles en la red social por parte de terceros, en particular por parte de quienes alimentan modelos de inteligencia artificial.

Es una elección que se hizo “para remediar los niveles extremos de recopilación y manipulación de datos del sistema”, explicó Elon Musk en un tuit. Ya el 30 de junio, el empresario estadounidense había anunciado que ya no sería posible leer mensajes en Twitter sin conectarse a través de una cuenta. “Casi todas las empresas de inteligencia artificial, desde las empresas emergentes hasta las corporaciones más grandes del mundo, recopilaban grandes cantidades de datos”, explicó Musk. “Es bastante irritante tener que poner en línea una gran cantidad de servidores en una emergencia solo para facilitar la valoración escandalosa de una puesta en marcha de IA”, agregó.

CRÍTICAS Y MIEDOS

Finalmente, los críticos han expresado su preocupación por el uso que hacen las empresas de la información publicada en línea para entrenar sus modelos de lenguaje grande para el uso de la IA generativa.

Como se mencionó al principio, recientemente se presentó una demanda colectiva contra OpenAI, el creador del popular bot de inteligencia artificial ChatGPT, acusándolo de haber tomado "enormes cantidades de datos personales de Internet", incluida "información privada robada", para entrenar sus plantillas GPT sin consentimiento previo.

Como señala Search Engine Journal , es probable que veamos muchas demandas similares en el futuro a medida que más empresas desarrollen sus propios productos de IA generativa.

Apenas la semana pasada en nuestro país , el Garante de Privacidad Pasquale Stanzione, con motivo de la presentación del Informe Anual 2022 , recordó que la intervención de la autoridad precisamente en ChatGpt “permitió encaminar el desarrollo de esta forma de inteligencia artificial generativa en una dirección compatible con la protección de la persona, contrastando la explotación de aquellos fragmentos del yo que son datos personales”.


Esta es una traducción automática de una publicación publicada en StartMag en la URL https://www.startmag.it/innovazione/perche-google-ha-modificato-la-policy-sulla-privacy-per-addestrare-ai-con-i-dati-pubblici/ el Mon, 10 Jul 2023 09:53:48 +0000.