Beneficios:
- Salario competitivo
- Horario flexible
- Oportunidad de avance
Científico de datos sénior (NLP / LLM / IA generativa)
Localidad: Dallas, TX
Roles y responsabilidades:
- Diseñe, construya, ajuste e implemente LLM, modelos de NLP basados en transformadores y soluciones GenAI para contextos por lotes y en tiempo real/transmisión.
- Poseer todos los componentes principales de las canalizaciones de ML: ingesta de datos, limpieza, preprocesamiento (estructurado y no estructurado), incrustación, búsqueda y recuperación, ingeniería rápida, RAG (Retrieval-Augmented Generation).
- Colaborar estrechamente con los ingenieros de ML, MLOps, ingeniería de software, productos, cumplimiento, legal, etc., para mover los modelos del prototipo a la producción, lo que garantiza la confiabilidad, la escalabilidad, el monitoreo y la capacidad de mantenimiento.
- Definir e implementar marcos de evaluación: precisión, sesgo, equidad, alucinación, consistencia, latencia; ejecutar UAT, pruebas de estrés, detección de deriva.
- Optimice los modelos y las canalizaciones para el rendimiento, el costo y la eficiencia.
- Garantizar las mejores prácticas en el desarrollo de modelos: control de versiones, repetibilidad, documentación, gobernanza y uso ético de la IA.
- Asesorar a más científicos de datos junior; ayudar a desarrollar habilidades de equipo en PNL, prácticas de GenAI, ingeniería rápida, ajuste.
- Identificar nuevos casos de uso; innovaciones prototipo en GenAI / NLP; Manténgase al día con las últimas investigaciones y desarrollos de código abierto, decida qué adoptar.
Calificaciones imprescindibles:
- 10+ años de experiencia en ciencia de datos / ML, con trabajo sustancial en NLP, LLM o IA generativa.
- Profunda experiencia práctica en Python, utilizando marcos como PyTorch, TensorFlow, HuggingFace, etc.
- Historial probado de construcción de modelos de transformadores / NLP / LLM; experiencia con ingeniería rápida y de ajuste.
- Sólida experiencia con la recuperación / búsqueda de información: palabra clave + búsqueda semántica, incrustaciones, bases de datos vectoriales.
- Experiencia trabajando en producción / implementación de modelos (batch y streaming), trabajando con prácticas de MLOps.
- Sólidos fundamentos algorítmicos / estadísticos / matemáticos. Capacidad para razonar sobre el comportamiento del modelo, el sesgo, la incertidumbre.
- Buen comunicador: capaz de traducir detalles técnicos complejos a las partes interesadas comerciales / no técnicas.
Es bueno tener:
- Máster en Ciencias de la Computación, Lingüística Computacional, Estadística, Machine Learning o campo relacionado.
- Experiencia con modelos multimodales (visión + texto) o LLM emergentes y sistemas basados en agentes.
- Experiencia con LLM y kits de herramientas de código abierto; familiaridad con LangChain o marcos similares.
- Experiencia previa en entornos regulados (finanzas, riesgo, legal, cumplimiento) con fuertes requisitos de gobernanza y privacidad.
Localidad: Dallas, TX
Roles y responsabilidades:
- Diseñe, construya, ajuste e implemente LLM, modelos de NLP basados en transformadores y soluciones GenAI para contextos por lotes y en tiempo real/transmisión.
- Poseer todos los componentes principales de las canalizaciones de ML: ingesta de datos, limpieza, preprocesamiento (estructurado y no estructurado), incrustación, búsqueda y recuperación, ingeniería rápida, RAG (Retrieval-Augmented Generation).
- Colaborar estrechamente con los ingenieros de ML, MLOps, ingeniería de software, productos, cumplimiento, legal, etc., para mover los modelos del prototipo a la producción, lo que garantiza la confiabilidad, la escalabilidad, el monitoreo y la capacidad de mantenimiento.
- Definir e implementar marcos de evaluación: precisión, sesgo, equidad, alucinación, consistencia, latencia; ejecutar UAT, pruebas de estrés, detección de deriva.
- Optimice los modelos y las canalizaciones para el rendimiento, el costo y la eficiencia.
- Garantizar las mejores prácticas en el desarrollo de modelos: control de versiones, repetibilidad, documentación, gobernanza y uso ético de la IA.
- Asesorar a más científicos de datos junior; ayudar a desarrollar habilidades de equipo en PNL, prácticas de GenAI, ingeniería rápida, ajuste.
- Identificar nuevos casos de uso; innovaciones prototipo en GenAI / NLP; Manténgase al día con las últimas investigaciones y desarrollos de código abierto, decida qué adoptar.
Calificaciones imprescindibles:
- 10+ años de experiencia en ciencia de datos / ML, con trabajo sustancial en NLP, LLM o IA generativa.
- Profunda experiencia práctica en Python, utilizando marcos como PyTorch, TensorFlow, HuggingFace, etc.
- Historial probado de construcción de modelos de transformadores / NLP / LLM; experiencia con ingeniería rápida y de ajuste.
- Sólida experiencia con la recuperación / búsqueda de información: palabra clave + búsqueda semántica, incrustaciones, bases de datos vectoriales.
- Experiencia trabajando en producción / implementación de modelos (batch y streaming), trabajando con prácticas de MLOps.
- Sólidos fundamentos algorítmicos / estadísticos / matemáticos. Capacidad para razonar sobre el comportamiento del modelo, el sesgo, la incertidumbre.
- Buen comunicador: capaz de traducir detalles técnicos complejos a las partes interesadas comerciales / no técnicas.
Es bueno tener:
- Máster en Ciencias de la Computación, Lingüística Computacional, Estadística, Machine Learning o campo relacionado.
- Experiencia con modelos multimodales (visión + texto) o LLM emergentes y sistemas basados en agentes.
- Experiencia con LLM y kits de herramientas de código abierto; familiaridad con LangChain o marcos similares.
- Experiencia previa en entornos regulados (finanzas, riesgo, legal, cumplimiento) con fuertes requisitos de gobernanza y privacidad.
Trabajar de forma remota temporalmente debido a COVID-19.
Compensación: $150,000.00 - $210,000.00 por año
Sobre nosotros
Trabajamos para ofrecer rentabilidad en su negocio, con comunicación efectiva, consultoría y soluciones interactivas. Siguiendo un enfoque de trabajo ágil, nos aseguramos de que obtenga las soluciones ideales a un costo mínimo.
Enfoque de trabajo
Nuestra Filosofía
Nuestra filosofía comienza y termina en el enfoque del cliente primero. Ya sea entendiendo los requisitos de su negocio o eligiendo las tecnologías adecuadas, trabajamos como un equipo colectivo que toma todas las medidas posibles para crecer continuamente hacia nuestro objetivo común.
Nuestra filosofía comienza y termina en el enfoque del cliente primero. Ya sea entendiendo los requisitos de su negocio o eligiendo las tecnologías adecuadas, trabajamos como un equipo colectivo que toma todas las medidas posibles para crecer continuamente hacia nuestro objetivo común.
Política de trabajo
Promovemos un ambiente de trabajo colaborativo. Involucramos a todos los que trabajan en la organización en las decisiones de la comunidad y los alentamos a pensar desde una perspectiva más amplia. Nuestro proceso de trabajo promueve la flexibilidad y mantenemos un alto nivel de disciplina en diferentes niveles de ejecución.
El futuro
SelectMinds tiene años de experiencia en el dominio nos ayuda a comprender mejor la necesidad del momento. Esta comprensión nos impulsa a un futuro mejor con cada minuto que pasa. Creemos que vamos a despegar a las principales empresas de sus posiciones emblemáticas, con los productos que estamos considerando hoy.
(si ya tienes un currículum en Indeed)