Mediciones
Cada cifra de esta página está vinculada a su fichero fuente publicado en /proofs/ — y la construcción del sitio falla si una cifra deja de coincidir con su fuente. Los registros en bruto se publican tal cual (el ocultamiento de los identificadores locales se declara en la primera línea; las cifras quedan intactas).
Recuperación de OOM en ejecución — tres fabricantes de GPU
Probado: arrancar configuraciones deliberadamente imposibles y dejar que la escala de recuperación trabaje (KV-quant → contexto → descarga). Resultado: NVIDIA RTX 3070 (CUDA): una solicitud de contexto de 262144 tokens recuperada a 131072, respuesta real servida. AMD Radeon 780M (Vulkan): recuperación 1000000→500000, servida. Apple M1 (Metal): funciona y sirve; la recuperación bajo OOM forzado aún no se ha demostrado ahí. 2026-06 · bruto: RESULTS → · AMD → · cross-platform →
Watchdog — colapso de VRAM en plena generación, presión real
Probado: un segundo proceso de GPU carga en plena generación (el evento «abres un juego»), en una RTX 4070 Laptop 8 GB. Resultado: umbral mínimo cruzado a 102 MiB libres → reinicio controlado → recuperado en 223.9 s a un contexto 8192 → 4096 en el mismo puerto, bajo presión sostenida — y luego respuesta servida. Coste honesto: la generación en curso se pierde. Contraprueba: 0 soft alerts, 0 interventions en generaciones normales. 2026-06-11 · registro en bruto →
Persistencia — la configuración con la que arrancó se conserva
Probado: arranque en frío y luego en caliente de un modelo MoE de 9.5 GB en la RTX 4070 8 GB; invalidación artificial de huella; entrada de caché envenenada. Resultado: plan en frío 222.63 s → arranque en caliente directamente sobre la configuración conocida; un intento fallido cuesta ~220 s de carga — la caché existe para no pagar nunca dos veces. Invalidación y supersede append-only probados. 2026-06-11 · registro en bruto →
Instalación — cero requisitos previos, anfitrión y VM limpia
Probado: entorno limpiado en el anfitrión, y luego una VM Windows 11 nueva sin ninguna herramienta (sin GPU → objetivo CPU). Resultado: anfitrión: 7.6 s de un arranque en frío a una respuesta servida (modelo de prueba de 1 GB en disco, descarga fijada b9592 + SHA256 obligatorio incluido). VM limpia: arrancado en 10.04s, 12.2s en total — después de que la pasada encontrara y corrigiera dos bloqueadores reales del primer lanzamiento (almacén TLS perezoso; DLLs MSVC ausentes). 2026-06-11 · registro en bruto →
Energía — medida, nunca estimada
Probado: RAPL (paquete CPU) + nvidia-smi durante el arranque y un decodificado de 256 tokens; Ryzen 7 8845HS + RTX 4070 Laptop. Resultado: decodificado 215.13 J en 4.41 s = 48.8 W de CPU de media = 0.84 J/token (CPU-side), GPU 37.4 W. Sin el instrumento de medición instalado, el campo está ausente — nunca estimado. 2026-06-11 · registro en bruto →