Tabla de Contenidos
¿Quién es Fei-Fei Li?
Fei-Fei Li es la científica que creó ImageNet, el dataset que desencadenó la revolución del deep learning. Si te preguntas quién es Fei-Fei Li en el contexto de la IA: es la investigadora cuyo trabajo hizo posible que las computadoras vean y entiendan imágenes, una capacidad que hoy usamos en todo, desde los filtros de Instagram hasta el diagnóstico médico.
Nacida en Beijing en 1976, emigró a Estados Unidos a los 16 años sin hablar inglés. Trabajó como limpiadora y cajera mientras estudiaba en Parsippany High School, New Jersey. Obtuvo su licenciatura en Princeton (física) y su doctorado en Caltech (ingeniería eléctrica). Hoy es profesora de Stanford, codirectora del Stanford Human-Centered AI Institute (HAI) y una de las voces más influyentes en la intersección de IA y humanismo.
Su historia es especialmente inspiradora para el contexto latinoamericano: una inmigrante que enfrentó barreras económicas y de idioma para llegar a la cima de su campo. El ILIA 2025 de CEPAL, que mide la adopción de IA en la región, se construye sobre avances que el trabajo de Li hizo posibles.
Lo que hace excepcional a Fei-Fei Li no es solo su contribución técnica, sino su visión de la IA como herramienta al servicio de la humanidad. En una época donde la carrera por la AGI (inteligencia artificial general) domina los titulares, Li ha sido una voz consistente abogando por una IA centrada en las personas, que amplíe las capacidades humanas en vez de reemplazarlas. Esta perspectiva es particularmente relevante para países en desarrollo como Perú, donde la IA debería ser una fuerza democratizadora que cierre brechas, no que las amplíe.
Su trayectoria académica es un modelo de perseverancia y brillantez. Después de Princeton y Caltech, Li se unió a la facultad de Stanford en 2009, donde dirigió el Stanford Vision Lab y el Stanford AI Lab (SAIL). A lo largo de su carrera ha publicado más de 300 papers científicos y ha sido mentora de docenas de investigadores que hoy lideran equipos de IA en Google, Meta, Apple y startups de todo el mundo. Su influencia se extiende mucho más allá de sus propias contribuciones directas.
En 2017, Li tomó una licencia de Stanford para ser Chief Scientist de AI/ML en Google Cloud, donde lideró la estrategia de democratización de herramientas de IA empresarial. Durante su tiempo en Google, impulsó servicios como Cloud Vision API y AutoML, que permiten a empresas sin equipos especializados en IA implementar visión artificial en sus productos. Después de dos años, regresó a Stanford para cofundar HAI, un instituto dedicado a estudiar el impacto de la IA en la sociedad.
ImageNet: el dataset que cambió todo
En 2006, cuando Li propuso crear ImageNet, la idea parecía loca. Quería construir una base de datos con millones de imágenes etiquetadas manualmente en miles de categorías. La comunidad académica la ignoró. Los fondos eran escasos. Muchos colegas consideraban el proyecto una pérdida de tiempo.
Li persistió. Usando Amazon Mechanical Turk (una plataforma de microtareas), logró que miles de personas etiquetaran millones de imágenes. El resultado fue ImageNet: 14 millones de imágenes en más de 21,000 categorías, el dataset de visión artificial más grande y mejor organizado del mundo.
En 2010, Li lanzó el ImageNet Large Scale Visual Recognition Challenge (ILSVRC), una competencia anual para evaluar algoritmos de reconocimiento de imágenes. Durante dos años, los resultados mejoraron incrementalmente. Luego vino 2012.
En 2012, AlexNet (creada por estudiantes de Geoffrey Hinton usando GPUs NVIDIA) ganó el ILSVRC con un margen aplastante. Fue la prueba definitiva de que el deep learning funcionaba, y ImageNet fue el combustible que lo hizo posible. Sin el dataset de Li, AlexNet no habría tenido datos con los cuales entrenarse.
| Año | Hito de ImageNet | Impacto |
|---|---|---|
| 2006 | Li propone el proyecto | Rechazo inicial de la academia |
| 2009 | ImageNet publicado (3.2M imágenes) | Primer dataset visual a gran escala |
| 2010 | Primer ILSVRC challenge | Benchmark estándar de visión artificial |
| 2012 | AlexNet gana con deep learning | Revolución del deep learning |
| 2015 | ResNet supera precisión humana | IA supera a humanos en clasificación |
| 2017 | Último ILSVRC | Problema considerado «resuelto» |
Para dimensionar el impacto de ImageNet, hay que entender cómo era la investigación en visión artificial antes de 2009. Los investigadores trabajaban con datasets pequeños (miles de imágenes) y las computadoras apenas podían distinguir un gato de un perro con fiabilidad. Li tuvo la visión radical de que el problema no eran los algoritmos, sino los datos. Si le dabas a una computadora suficientes ejemplos del mundo visual, aprendería a ver.
El proyecto fue titánico: Li y su equipo organizaron más de 14 millones de imágenes en 21,841 categorías usando Amazon Mechanical Turk para el etiquetado manual. Muchos colegas consideraron el proyecto una pérdida de tiempo. Pero en 2012, cuando AlexNet (una red neuronal profunda) ganó el ImageNet Large Scale Visual Recognition Challenge (ILSVRC) con un margen aplastante sobre métodos tradicionales, quedó claro que Li tenía razón. Ese momento es considerado el Big Bang del deep learning moderno.
Sin ImageNet, no existirían los modelos generativos de imágenes como DALL-E, Midjourney o Stable Diffusion. No existiría la búsqueda visual de Google. Los autos autónomos estarían décadas atrasados. Prácticamente toda la revolución de deep learning que vivimos hoy se puede trazar directamente al trabajo de Fei-Fei Li y su insistencia en que la escala de datos era la clave.
De Stanford a Google Cloud y de vuelta
La carrera de Li combina academia e industria de forma poco común. Como profesora de Stanford, dirige investigación en visión artificial, IA para salud y robótica. Su laboratorio ha producido avances en detección de actividades, comprensión de escenas y generación de descripciones de imágenes.
En 2017-2018, Li tomó una licencia de Stanford para ser VP y Chief Scientist de Google Cloud AI. Su trabajo allí incluyó democratizar el acceso a herramientas de IA para empresas y desarrollar Cloud AutoML, que permite entrenar modelos de visión artificial sin experiencia en programación.
Después de regresar a Stanford, cofundó el Human-Centered AI Institute (HAI), que promueve una visión de la IA centrada en las personas. HAI investiga no solo cómo hacer IA más potente sino cómo asegurarse de que beneficie a la humanidad, incluyendo temas de sesgo, equidad, privacidad y regulación.
En 2024, Li fundó World Labs, una startup de IA valorada en más de $1 mil millón que trabaja en «large world models»: modelos que entienden el mundo 3D a partir de imágenes, lo que podría revolucionar la robótica, los videojuegos y la realidad aumentada.
World Labs, la startup que Li fundó en 2024, representa la siguiente frontera de la visión artificial. La empresa trabaja en «spatial intelligence»: la capacidad de las máquinas para entender y razonar sobre el mundo físico tridimensional a partir de imágenes y videos. Esto va mucho más allá de reconocer objetos en fotos; se trata de que la IA entienda profundidad, geometría, física y relaciones espaciales.
Las implicaciones prácticas son enormes. Un robot con spatial intelligence podría navegar un almacén peruano desordenado sin mapas predefinidos. Un sistema de realidad aumentada podría superponer información sobre el mundo real con precisión milimétrica. Un videojuego podría generar mundos 3D fotorrealistas automáticamente. World Labs levantó más de $230 millones en su primera ronda de financiamiento, reflejando la confianza de los inversionistas en la visión de Li.
Visión artificial: aplicaciones reales
El trabajo de Li en visión artificial tiene aplicaciones directas que tocan la vida diaria:
Medicina: algoritmos entrenados con las técnicas que Li pionera detectan cáncer en radiografías, retinopatía diabética en fotos del ojo y fracturas en rayos X. Hospitales en todo el mundo, incluyendo Latinoamérica, implementan estas herramientas.
Retail: el reconocimiento de productos en Amazon Go (tiendas sin cajero) y la búsqueda visual de Google (apuntas la cámara y Google te dice qué es) dependen de visión artificial avanzada.
Agricultura: drones con visión artificial detectan plagas y enfermedades en cultivos. Para el sector agrícola peruano (café, cacao, quinua, espárrago), estas tecnologías pueden optimizar rendimientos y reducir pérdidas.
Seguridad: sistemas de vigilancia inteligente que detectan actividades sospechosas, reconocimiento facial (con sus controversias éticas) y monitoreo de tráfico usan técnicas de visión artificial que se remontan a ImageNet.
¿Cómo afecta al mercado peruano?
La visión artificial creada sobre el legado de Fei-Fei Li está llegando a Perú en aplicaciones concretas. El sector agrícola usa drones con IA para monitoreo de cultivos. El sector minero implementa inspección visual automatizada. El sector salud está adoptando diagnóstico asistido por IA.
El D.S. 115-2025-PCM sobre uso de IA en entidades públicas peruanas abre la puerta a implementaciones de visión artificial en fiscalización, seguridad ciudadana y gestión de documentos. Los modelos open source entrenados con las metodologías que Li pionera están disponibles en Hugging Face para que desarrolladores peruanos los usen.
La historia de Li, de inmigrante sin recursos a líder mundial en IA, resuena con el espíritu emprendedor peruano. Su mensaje es que los grandes avances en IA no requieren recursos ilimitados sino visión, persistencia y buenos datos.
La influencia de Fei-Fei Li en el mercado peruano va más allá de la tecnología directa. Su trabajo en HAI Stanford ha producido investigaciones sobre el impacto social de la IA que informan políticas públicas globalmente. El AI Index Report, publicado anualmente por HAI, es uno de los documentos de referencia que gobiernos y organizaciones usan para diseñar estrategias de IA. El D.S. 115-2025-PCM de Perú sobre uso de IA en el sector público se basa en marcos conceptuales que Li y su equipo han ayudado a desarrollar.
Para el sector agrícola peruano, la visión artificial tiene aplicaciones inmediatas que pueden generar valor económico significativo. La detección automatizada de plagas en cultivos de espárragos, arándanos y paltas de exportación podría reducir pérdidas y optimizar el uso de pesticidas. Empresas agroindustriales en Ica, La Libertad y Lambayeque ya están experimentando con drones equipados con cámaras y algoritmos de visión artificial para monitoreo de cultivos.
En el sector minero, la visión artificial permite el análisis automatizado de muestras geológicas, la inspección de seguridad en minas a tajo abierto y el monitoreo ambiental de operaciones extractivas. Considerando que la minería representa más del 10% del PBI peruano, cualquier mejora de eficiencia por adopción de tecnología de visión artificial tiene un impacto macroeconómico relevante.
El legado de Fei-Fei Li nos recuerda que los mayores avances en IA no siempre vienen de las empresas más grandes o los presupuestos más generosos. A veces vienen de una investigadora con una idea aparentemente simple (necesitamos más datos) y la tenacidad de ejecutarla contra la corriente. Para emprendedores y científicos peruanos, esa lección es tan valiosa como cualquier algoritmo.
Preguntas frecuentes
¿Qué es ImageNet?
Es una base de datos de más de 14 millones de imágenes etiquetadas en 21,000+ categorías. Creada por Fei-Fei Li desde 2006, fue el dataset que demostró que el deep learning funciona para visión artificial y desencadenó la revolución de IA moderna.
¿Por qué ImageNet fue tan importante?
Porque proporcionó los datos necesarios para entrenar redes neuronales profundas de visión. Sin ImageNet, AlexNet (2012) no habría existido, y sin AlexNet, la revolución del deep learning habría tardado años más.
¿Fei-Fei Li sigue en Stanford?
Sí, es profesora de Stanford y codirectora del Human-Centered AI Institute. También fundó World Labs en 2024, una startup que trabaja en modelos que entienden el mundo 3D.
¿Qué es HAI Stanford?
El Human-Centered AI Institute de Stanford, cofundado por Li, investiga cómo desarrollar IA que beneficie a la humanidad. Cubre temas de sesgo, equidad, regulación y aplicaciones sociales de la IA.
¿La visión artificial se usa en Perú?
Sí, en sectores como agricultura (drones con IA), minería (inspección visual), salud (diagnóstico asistido) y retail. Los modelos open source hacen que implementar visión artificial sea cada vez más accesible para empresas peruanas. Empresas como Solera y startups en el ecosistema de Wayra y Emprende UP están desarrollando soluciones de visión artificial adaptadas a necesidades específicas del mercado local, desde control de calidad en plantas de procesamiento de alimentos hasta sistemas de seguridad ciudadana.
La visión artificial está transformando industrias en todo el mundo. Si quieres que tu negocio en Perú sea visible en los motores de IA, trabaja tu posicionamiento GEO. En KOM te ayudamos — escríbenos al WhatsApp.








