Engenheiro de ml foco – Rio de Janeiro

  • Período Integral
  • Rio de Janeiro

    Confidencial


    Você quer fazer parte de uma empresa de tecnologia que está há mais de 20 anos no mercado, que não apenas é parceira premier do Google Cloud, mas também já foi 5 vezes premiada como Partner of the year? Uma empresa que além de ser fera naquilo que faz, também valoriza e leva a sério o compromisso com cada IPNETER, possuindo há 6 anos consecutivos o selo Great Place To Work.

    Pois é, essa empresa existe. Essa empresa é a IPNET!

    Além disso, somos comprometidos com a inclusão, abraçando cada forma única de ser humano, independente de etnia, gênero, orientação sexual, idade, habilidades físicas ou mentais. Por isso, todas as nossas vagas são inclusivas. Aqui, não apenas reconhecemos, mas também celebramos as diferentes identidades, experiências e talentos de cada pessoa que faz parte do nosso time.

    E, Estamos Com Uma Vaga Aberta Para Engenheiro De ML Foco Em Google Cloud Gen AI & LLM, Que Irá Atuar Dentro Do Nosso Time De Delivery Team, Sendo Responsável Por

    • Trabalhar com modelos de linguagem de larga escala (LLMs), incluindo modelos fundacionais como Gemini, GPT, LLaMA, bem como configurar parâmetros como tokens, temperatura, top-k e top-p conforme as necessidades do projeto.
    • Desenvolver e integrar agentes conversacionais utilizando ferramentas do ecossistema Google, como Dialogflow, Playbooks, Agent Builder e diferentes versões do modelo Gemini Flash.
    • Criar e implantar agentes de voz baseados em modelos de TTS (Text-to-Speech) e STT (Speech-to-Text), promovendo experiências de conversação por voz fluídas e eficientes.
    • Construir, manter e evoluir agentes conversacionais, garantindo performance, escalabilidade e aderência aos requisitos funcionais e não funcionais.
    • Realizar o deploy de agentes conversacionais em ambientes produtivos, promovendo confiabilidade e facilidade de manutenção.
    • Aplicar técnicas de otimização de LLMs como distillation, transfer learning e fine tuning para personalização e melhoria de desempenho dos modelos.
    • Desenvolver soluções baseadas em RAG (Retrieval-Augmented Generation) e grounding, garantindo geração de respostas mais precisas e com base em fontes confiáveis.
    • Criar prompts eficientes utilizando diversas estratégias de prompt engineering (zero-shot, one-shot, few-shot, prompting contextual, chain of thought, tree of thoughts, entre outros), além de aplicar soluções de segurança como Prompt Defender.
    • Trabalhar com tecnologias e frameworks de NLU (Natural Language Understanding) e NLP (Natural Language Processing) para interpretação e processamento de linguagem natural.
    • Otimizar o uso de janelas de contexto em LLMs por meio de estratégias de chunking e segmentação de dados.
    • Conduzir análises exploratórias de dados (EDA) para subsidiar decisões em processos de desenvolvimento e treinamento de modelos.
    • Programar em Python ou outra linguagem relevante, com foco em desenvolvimento de soluções baseadas em IA e automação de fluxos conversacionais.
    • Definir, testar e validar casos de uso de forma estruturada, assegurando que os agentes estejam alinhados aos objetivos de negócio e à experiência do usuário final.

    Entendemos que para atender as demandas da vaga, é necessário que o candidato possua:

    • Formação completa em Tecnologia da Informação, Análise e Desenvolvimento de Sistemas, Engenharia da Computação, Sistemas da Informação ou áreas correlacionadas
    • Conhecimento em modelos de linguagem de larga escala (LLMs), como GPT, Gemini e LLaMA.
    • Experiência no desenvolvimento e integração de agentes conversacionais com ferramentas como Dialogflow, Agent Builder e Gemini Flash.
    • Experiência na criação e implantação de agentes de voz utilizando tecnologias de TTS (Text-to-Speech) e STT (Speech-to-Text).
    • Conhecimento em técnicas de prompt engineering (zero-shot, few-shot, chain of thought, etc.).
    • Conhecimento em soluções baseadas em RAG (Retrieval-Augmented Generation) e grounding para geração de respostas baseadas em dados confiáveis.
    • Experiência em programação com foco em IA, preferencialmente em Python.
    • Experiência com deploy e manutenção de agentes em ambientes produtivos, garantindo escalabilidade e confiabilidade.

    Na IPNET by Vivo, acreditamos no trabalho híbrido como forma de fortalecer nossa cultura e acelerar nosso engajamento, respeitando, ao mesmo tempo, a flexibilidade. Por essa razão, nossa proposta consiste em trabalhar 2X na semana home-office e 3X presencialmente no escritório. Atualmente, contamos com dois escritórios no Brasil: um no Rio de Janeiro (Zona Portuária/Santo Cristo) e outro em São Paulo (Cidade Monções/Sede Eco Berrini).

    Reconhecemos a importância dos benefícios, e por isso, nosso pacote contempla:

    Auxílio Refeição/Alimentação

    Auxílio Transporte

    Plano de Saúde

    Plano Odontológico

    Auxílio Home-Office

    Wellhub

    Seguro de Vida

    Auxílio Creche/Babá

    Happy Day no mês do seu aniversário

    Parcerias com instituições educacionais, tanto de idiomas quanto acadêmicas

    Se você se identificou com os requisitos descritos acima, não pense 2 vezes. Venha fazer parte de uma empresa que abraça a inovação e onde o caos não assusta, porque somos um time que joga junto, possui um papo reto e uma cabeça de dono!


    Para se candidatar a esta vaga, por favor visite www.netvagas.com.br.