Científico de datos sénior de GenAI Temporarily Remote - US

Científico de datos sénior de GenAI

Tiempo completo • Temporarily Remote - US
Beneficios:
  • Salario competitivo
  • Horario flexible
  • Oportunidad de avance
Científico de datos sénior (NLP / LLM / IA generativa)
Localidad: Dallas, TX

Roles y responsabilidades:
- Diseñe, construya, ajuste e implemente LLM, modelos de NLP basados en transformadores y soluciones GenAI para contextos por lotes y en tiempo real/transmisión.
- Poseer todos los componentes principales de las canalizaciones de ML: ingesta de datos, limpieza, preprocesamiento (estructurado y no estructurado), incrustación, búsqueda y recuperación, ingeniería rápida, RAG (Retrieval-Augmented Generation).
- Colaborar estrechamente con los ingenieros de ML, MLOps, ingeniería de software, productos, cumplimiento, legal, etc., para mover los modelos del prototipo a la producción, lo que garantiza la confiabilidad, la escalabilidad, el monitoreo y la capacidad de mantenimiento.
- Definir e implementar marcos de evaluación: precisión, sesgo, equidad, alucinación, consistencia, latencia; ejecutar UAT, pruebas de estrés, detección de deriva.
- Optimice los modelos y las canalizaciones para el rendimiento, el costo y la eficiencia.
- Garantizar las mejores prácticas en el desarrollo de modelos: control de versiones, repetibilidad, documentación, gobernanza y uso ético de la IA.
- Asesorar a más científicos de datos junior; ayudar a desarrollar habilidades de equipo en PNL, prácticas de GenAI, ingeniería rápida, ajuste.
- Identificar nuevos casos de uso; innovaciones prototipo en GenAI / NLP; Manténgase al día con las últimas investigaciones y desarrollos de código abierto, decida qué adoptar.

Calificaciones imprescindibles:
- 10+ años de experiencia en ciencia de datos / ML, con trabajo sustancial en NLP, LLM o IA generativa.
- Profunda experiencia práctica en Python, utilizando marcos como PyTorch, TensorFlow, HuggingFace, etc.
- Historial probado de construcción de modelos de transformadores / NLP / LLM; experiencia con ingeniería rápida y de ajuste.
- Sólida experiencia con la recuperación / búsqueda de información: palabra clave + búsqueda semántica, incrustaciones, bases de datos vectoriales.
- Experiencia trabajando en producción / implementación de modelos (batch y streaming), trabajando con prácticas de MLOps.
- Sólidos fundamentos algorítmicos / estadísticos / matemáticos. Capacidad para razonar sobre el comportamiento del modelo, el sesgo, la incertidumbre.
- Buen comunicador: capaz de traducir detalles técnicos complejos a las partes interesadas comerciales / no técnicas.

Es bueno tener:
- Máster en Ciencias de la Computación, Lingüística Computacional, Estadística, Machine Learning o campo relacionado.
- Experiencia con modelos multimodales (visión + texto) o LLM emergentes y sistemas basados en agentes.
- Experiencia con LLM y kits de herramientas de código abierto; familiaridad con LangChain o marcos similares.
- Experiencia previa en entornos regulados (finanzas, riesgo, legal, cumplimiento) con fuertes requisitos de gobernanza y privacidad.

Trabajar de forma remota temporalmente debido a COVID-19.

Compensación: $150,000.00 - $210,000.00 por año




(si ya tienes un currículum en Indeed)

O aplicar aquí.

* campos requeridos

Ubicación
Or
Or