n8n으로 나만의 RAG AI 음성 에이전트 만들기
안녕하세요. 이 글은 유튜브채널 “FuturMinds”에서 공개한 “Build Your OWN RAG AI Voice Agent with n8n | Complete Step-by-Step Tutorial” 관련 동영상을 정리한 것입니다. 이 글의 정리 목적은 저희가 필요할 때 자체 검색용, 그리고 참고 목적으로 약식 정리한 것이므로, 개괄적인 내용만 정리했습니다. 세부적이고 보다 자세한 내용은 링크를 참조하여 해당 동영상을 직접 시청하세요.
RAG AI 음성 비서 구축 소개
이 튜토리얼에서는 무료 오픈 소스 자동화 도구인 n8n을 이용하여 개인화된 RAG 음성 비서를 구축하는 방법을 소개합니다. 사용자가 음성 쿼리를 통해 질문하고 이에 대해 지능적으로 맞춤형 응답을 제공받도록 되어 있습니다. 이 시스템은 문서와 웹사이트의 데이터에 접근하여 작동합니다.
워크플로우 전체 흐름
우선, n8n 플랫폼을 활용하여 전체 프로세스를 구성합니다. 첫 번째로 파일 업데이트나 새로운 파일이 추가될 때를 감지하는 트리거를 통해 Google Drive에 있는 문서를 처리합니다. 문서가 추가되면 이를 다운로드하고 임베딩을 생성하여 Pinecone 벡터 데이터베이스에 저장합니다. 두 번째로, 음성 쿼리를 처리하는 워크플로우를 만들어 사용자의 음성을 텍스트로 변환한 후, AI 비서가 적절한 응답을 생성하여 이를 다시 오디오로 변환합니다.
Google Drive와의 연결 설정
첫 번째 워크플로우에서는 n8n 대시보드에서 Google Drive를 첫 번째 노드로 추가합니다. 특정 폴더의 변경 사항을 감지하는 트리거를 설정하고 API를 연결해야 하므로 Google Cloud Console에서 Google Drive API를 활성화합니다. 이후 OAuth 동의를 위한 애플리케이션을 설정하고, 이를 통해 생성된 클라이언트 ID와 비밀키를 n8n에 연결합니다.
임베딩 생성 및 데이터베이스에 저장
Google Drive에서 문서를 다운로드한 후, 이 문서를 여러 개의 청크로 분할하고 Pinecone 벡터 데이터베이스에 저장합니다. Pinecone은 임베딩을 생성하고 이를 벡터 데이터베이스에 저장하는 기능을 제공합니다. 이 과정에서 데이터를 더 효율적으로 검색할 수 있도록 메타데이터를 추가하는 것도 중요합니다.
음성 쿼리 처리 워크플로우 구축
두 번째 워크플로우는 사용자의 음성 쿼리를 수신하여 이를 텍스트로 변환 후 처리하는 역할을 합니다. 웹훅 노드를 추가하여 오디오를 수신하고, OpenAI 노드를 통해 이를 텍스트로 변환합니다. AI 비서는 음성 쿼리에 대한 적절한 응답을 생성하여 다시 음성으로 변환합니다.
WordPress 플러그인 통합
마지막으로, 구축된 음성 비서를 웹사이트에 통합하기 위해 WordPress 플러그인을 생성합니다. WordPress의 파일 관리자에서 새로운 디렉토리를 만들어 필요한 파일들을 추가하고, JavaScript를 활용하여 사용자의 음성 입력을 처리하도록 설정합니다. 이 과정에서 세션 ID를 생성하고 이를 모든 웹훅 호출에 포함시켜 사용자 별로 대화 기록을 유지합니다.
수고하신 만큼, 최종적으로 구축된 비서를 테스트할 수 있습니다. 성공적으로 응답이 돌아오는 것을 확인한 후, 관련 데이터를 n8n 대시보드에서 검토하여 흐름이 제대로 작동하는지 확인합니다.
이 과정을 통해 맞춤형 RAG AI 음성 비서를 구축하는 데 필요한 기초적인 내용을 배우셨다면 좋겠습니다. 보다 세부적이고 정확한 내용을 해당 동영상 시청으로 확인하시기 바랍니다.
동영상 게시일 : 2024-11-30
동영상 링크: 여기에서 확인하세요.