JUE, 26 / MAR / 2026

GitHub utilizará datos de los usuarios para entrenar a su IA

La compañía está interesada en las instancias de interacción con Copilot. Por defecto asumirá que los usuarios están de acuerdo en compartir la información.

GitHub ha anunciado que utilizará datos de sus usuarios para entrenar a sus modelos de inteligencia artificial. A partir del 24 de abril las cuentas de Copilot Free, Pro y Pro+ se convertirán por defecto en colaboradoras de los proyectos. Las cuentas de Copilot Business y Enterprise, así como las de profesores y estudiantes, estarán exceptuadas.

Colaboradores por defecto

Los usuarios que sean incluidos en la recolección de datos podrán salir del sistema. GitHub afirma que esta política se ajusta a prácticas ya establecidas dentro de la industria. La compañía cita como ejemplo a JetBrains, Anthropic y Microsoft.

Microsoft es la dueña de GitHub, por lo cuál es prácticamente como decir “si lo hago yo también lo puedo hacer yo”. Por otro lado los estándares de la industria no están tan bien definidos como pretende la empresa. En Estados Unidos se siguen políticas de consentimiento por defecto y opciones de salida, pero en Europa se presume el no consentimiento y se dan opciones para incorporarse a los programas de recolección de datos.

Críticos de la nueva política de la compañía han apuntado que los repositorios que se presentan como privados no lo son ya realmente. En la sección de preguntas frecuentes se señala que mientras se utilice Copilot, y la recolección de datos esté activa, se tomará información del repositorio.

Los datos de la interacción con los usuarios

GitHub tomará nota de, entre otros elementos, cuáles sugerencias de su IA son aceptadas o modificadas, los comentarios y la documentación producida por los usuarios, los nombres de los archivos, la estructura de los repositorios y la interacción con los distintos elementos de Copilot.

Según el jefe de producto de la empresa, Mario Rodriguez, los datos de las interacciones le permiten a los modelos entender mejor los flujos de trabajo, ofrecer patrones de código más acertados y seguros, así como también ser más eficaces a la hora de detectar errores.

Comentarios