Na última quarta-feira, 26 de junho, tivemos na IBM São Paulo o #technights18 sobre AI & Hybrid Cloud, tendências e futuro!! O Bruno Garcia, que é Principal Data & AI Tech Sales Manager, e o Fernando Sousa, IBM Public Cloud Tech Sales Manager, ambos em IBM Technology Brasil, falaram sobre o impacto da IA generativa nos negócios atualmente e também as preocupações em relação à governança e escalabilidade. Também como a nuvem da IBM pode provisionar e ajudar esses pontos ao nível produtivo.
Ao final, Tulio Coppola, Research Software Engineer apresentou uma demonstração do InstructLab, abrindo os eventos das iniciativas da comunidade técnica da IBM Brasil nesse assunto que promete mudar como especializamos nossos grandes modelos de linguagem!
O InstructLab usa um novo método de ajuste de alinhamento baseado em dados sintéticos para Large Language Models (LLMs). O "laboratório" no InstructLab significa Alinhamento em Grande Escala para ChatBots. Saiba mais aqui. E nas documentações da RedHat.
O que é ilab?
ilab é uma ferramenta de interface de linha de comando (CLI) que permite executar as seguintes ações:
- Baixe um Large Language Model (LLM) pré-treinado.
- Converse com o LLM.
Para adicionar novos conhecimentos e habilidades ao LLM pré-treinado, adicione informações ao repositório de taxonomia complementar.
Depois de adicionar conhecimentos e habilidades à taxonomia, você poderá executar as seguintes ações:
- Use o ilab para gerar novos dados de treinamento sintéticos com base nas alterações no seu repositório de taxonomia local.
- Treine novamente o LLM com os novos dados de treinamento.
- Converse com o LLM retreinado para ver os resultados.
Para começar com o InstructLab, siga o tutorial presente aqui.
Como funciona o InstructLab?
O método LAB consiste em 3 componentes:
- Curadoria de dados orientada pela taxonomia.
- Geração de dados sintéticos em larga escala.
- Ajuste de alinhamento iterativo e em grande escala.
As contribuições de dados da comunidade podem levar a construções iterativas regulares de LLMs melhorados, cada um melhorado pela árvore de competências geradas a partir das contribuições da comunidade.
Qual a diferença entre o InstructLab e RAG?
RAG é um método econômico para complementar um LLM com conhecimento específico de domínio que não fazia parte de seu pré-treinamento. O RAG possibilita que um chatbot responda com precisão a perguntas relacionadas a uma área ou negócio específico sem retreinar o modelo. Os documentos de conhecimento são armazenados em um banco de dados vetorial, depois recuperados em partes e enviados ao modelo como parte das consultas do usuário. Isso é útil para quem deseja adicionar dados proprietários a um LLM sem abdicar do controle de suas informações ou para quem precisa de um LLM para acessar informações oportunas. Saiba mais sobre RAG aqui.
Mais algumas fotos:
#watsonx.ai
#MachineLearning
#GenerativeAI