Qué significa el pago por rastreo de Cloudflare para las empresas de IA y los editores

Cloudflare, la empresa de infraestructura que se sitúa delante de una gran parte de los sitios web del mundo, ha introducido una política que podría cambiar la economía de la industria de la IA. Con el nuevo enfoque, la empresa bloqueará por defecto a los rastreadores de IA y dará a los editores que protege una forma de cobrarles por el acceso, un modelo que llama pago por rastreo.
Para entender por qué importa, conviene saber qué hacen los rastreadores. Los bots automatizados llevan mucho tiempo recorriendo la web, descargando páginas para que los motores de búsqueda las indexen. Las empresas de IA ahora operan sus propios rastreadores para recopilar las enormes cantidades de texto e imágenes que usan para entrenar grandes modelos de lenguaje y responder a las preguntas de los usuarios, a menudo sin compensar a los sitios cuyo trabajo consumen.
Ese desequilibrio es el agravio que Cloudflare dice estar abordando. Los editores sostienen que los sistemas de IA ingieren sus artículos, imágenes y datos, y luego sirven respuestas que evitan que los lectores lleguen a visitar el sitio original, erosionando los ingresos por publicidad y suscripción que financian el periodismo y otros contenidos. El trato tradicional, en el que la búsqueda devolvía tráfico a cambio de acceso, se ha debilitado a medida que las respuestas de la IA retienen a los usuarios en su lugar.
La respuesta de Cloudflare invierte la configuración por defecto. En lugar de permitir que los bots de IA rastreen libremente a menos que un sitio tome medidas para bloquearlos, la empresa tratará a los rastreadores de IA como bloqueados a menos que un editor decida permitirlos, y ofrece un mecanismo para que el editor fije un precio de acceso. En efecto, convierte el rastreo de una actividad gratuita por defecto en una transacción potencialmente de pago.
Como Cloudflare se sitúa delante de tantos sitios, el cambio tiene un peso inusual. Que un solo proveedor de infraestructura adopte esta postura puede desplazar las normas de la industria de una forma que ningún editor individual, actuando solo, podría lograr jamás. Da a los sitios web una palanca colectiva de la que carecían en las negociaciones con empresas de IA mucho mayores.
Para las empresas de IA, las implicaciones van en varias direcciones. Si una parte significativa de la web empieza a cobrar por el acceso de los rastreadores, el coste de recopilar datos de entrenamiento y en tiempo real podría aumentar, y la web abierta libremente rastreable podría encogerse. Las firmas podrían tener que cerrar acuerdos de licencia, pagar tarifas por rastreo o apoyarse más en los datos que ya poseen o que pueden obtener de socios dispuestos.
La política también se cruza con una oleada de disputas legales y comerciales sobre la IA y los derechos de autor. Editores y titulares de derechos han presentado demandas y firmado acuerdos de licencia con desarrolladores de IA, y una capa técnica de aplicación como la de Cloudflare podría reforzar su posición negociadora al dificultar de entrada el rastreo no autorizado.
Hay preguntas abiertas y riesgos. Algunos temen que restringir el contenido tras tarifas de rastreo pueda fragmentar la web abierta o perjudicar a los desarrolladores e investigadores de IA más pequeños que no pueden permitirse grandes presupuestos de licencia, afianzando potencialmente a los mayores actores. Otros señalan que rastreadores decididos podrían buscar formas de sortear esos controles, montando un juego técnico del gato y el ratón.
La medida también plantea la cuestión más amplia de quién fija las reglas de la fontanería de la web. Concentrar ese poder en un puñado de empresas de infraestructura tiene ventajas para la coordinación pero inquietudes para la competencia, y el pago por rastreo pondrá a prueba cuán cómoda se siente la industria con ese papel de guardián.
Lo que está claro es que la relación entre las empresas de IA y los sitios web de los que dependen se está renegociando en tiempo real. El pago por rastreo de Cloudflare es uno de los intentos más concretos hasta la fecha de poner precio al contenido que alimenta la IA, y sea cual sea el desenlace, señala que la era de cosechar libremente la web abierta podría estar llegando a su fin.
Para seguir leyendo

Datos de geolocalización: qué significa la prohibición de Virginia de vender tu ubicación
Virginia ha optado por prohibir la venta de datos de geolocalización precisos, restringiendo un floreciente comercio de información sobre los desplazamientos de las personas. Este análisis explica qué son los datos de geolocalización, cómo se recopilan y venden, y por qué cada vez más legisladores quieren limitar la práctica.

Vuelo supersónico silencioso: cómo la propuesta de la FAA podría revivir los viajes más rápidos que el sonido
El regulador aéreo de Estados Unidos ha propuesto permitir que los aviones supersónicos sobrevuelen las ciudades estadounidenses si son lo bastante silenciosos, informa Ars Technica. El plan sustituiría una prohibición total de décadas del vuelo supersónico sobre tierra por un estándar basado en el ruido.

¿Por qué Suiza tiene internet de 25 Gbit y Estados Unidos no?
Un análisis muy compartido se pregunta por qué Suiza ofrece velocidades de internet doméstico de 25 gigabits mientras buena parte de Estados Unidos se queda atrás. Este análisis examina la infraestructura, la regulación y la estructura de mercado que determinan cuán rápida y asequible llega a ser la banda ancha de un país.

Anthropic negocia con Samsung un chip de IA personalizado, informa TechCrunch
Anthropic, la empresa de IA tras el chatbot Claude, está negociando un nuevo chip personalizado con Samsung, informa TechCrunch. Las conversaciones reflejan una carrera más amplia entre empresas de IA por asegurar y adaptar el hardware que impulsa sus modelos y reducir la dependencia de un solo proveedor.

Google pierde el recurso antimonopolio en la UE y deberá pagar una multa récord de 4.700 millones de dólares
Google ha perdido un recurso de larga duración contra una multa antimonopolio récord de la Unión Europea y debe pagar unos 4.700 millones de dólares, informa Ars Technica. La sanción deriva de las conclusiones de la UE sobre cómo Google usó su sistema operativo móvil Android para afianzar su motor de búsqueda.