“Google Gemini 2.0와 n8n으로 만드는 자동화된 AI 베드타임 스토리: 일관된 캐릭터와 어우러진 플래시 + 피쉬 오디오 조합”
안녕하세요. 이 글은 유튜브채널 “Andy Lo”에서 공개한 “Google Gemini 2.0 Flash + Fish Audio + n8n = AI Bedtime Story With Consistent Character On Autopilot” 관련 동영상을 정리한 것입니다. 이 글의 정리 목적은 저희가 필요할 때 자체 검색용, 그리고 참고 목적으로 약식 정리한 것이므로, 개괄적인 내용만 정리했습니다. 세부적이고 보다 자세한 내용은 링크를 참조하여 해당 동영상을 직접 시청하세요.
AI 에이전트 시스템 구축
AI 에이전트를 활용한 시스템을 구축하여 자동으로 AI 베드타임 스토리를 생성하고 배포하는 방법에 대해 설명합니다. Google Gemini 2.0과 Fish Audio, n8n을 이용해 영상 제작을 자동화하고 있습니다. 이 시스템을 통해 이미 26,000명 이상의 구독자를 보유한 유튜브 채널이 있으며, 각 영상이 평균적으로 20,000에서 30,000회의 조회수를 기록하고 있습니다. 이로 인해 월 6,000달러 이상의 수익을 올릴 수 있습니다. 설정은 한 번만 해주면 AI가 모든 작업을 자동으로 처리합니다.
자동화된 AI 영상 생성 시스템 작동 방식
시스템과 워크플로우는 네 가지 주요 단계로 나뉩니다.
- Google Sheet에서 주제와 구성을 가져옵니다.
- Gemini 2.0 Flash를 사용하여 스토리를 자동으로 생성하고 관련 이미지를 생성합니다.
- Fish Audio를 이용해 전문 품질의 음성을 만듭니다.
- n8n No Code API를 통해 영상으로 변환합니다.
비용과 워크플로우
10분 길이의 음성 생성 비용은 약 0.05달러입니다. n8n을 통해의 최종 비디오 제작 비용은 약 0.10달러이며, 전체 비용은 0.15달러로 저렴합니다. 각 단계는 자동화되어 있으며, 매일 또는 매 시간 실행될 수 있습니다.
Google Sheets와 설정 단계
Google Sheets에서 언어, 음성 ID, 주제, 청중, 캐릭터, 길이 등 여러 설정을 포함합니다. Fish Audio를 통해 저렴하게 음성 ID를 생성하고, 그 후 해당 정보를 활용하여 스토리를 생성하고 프로세스를 진행합니다.
이미지 생성 및 업로드
생성된 이미지는 Superbase에 업로드되어 링크 형태로 저장됩니다. 업로드 방식도 단순하며, 데이터 변환 및 정리 작업을 포함합니다. 각 이미지가 성공적으로 업로드되면 링크가 생성되어 후속 작업에서 활용됩니다.
음성 및 비디오 생성 과정
Fish Audio를 사용하여 생성된 음성을 바탕으로 별도의 비디오 파일이 생성됩니다. 이 과정을 통해 음성을 베이스로 시청자가 원하는 영상을 제작합니다. 이후 업로드된 음성 파일이 Superbase에 저장되어, 해당 URL로 비디오를 완성합니다.
최종적인 동영상 생성
이 모든 과정이 완료된 후, n8n No Code API를 통해 최종 비디오가 생성됩니다. 이 과정은 전반적으로 자동화되어 실시간으로 처리가 가능하며, 한 번의 설정으로 지속적인 비디오 생성이 가능합니다.
세부적이고 정확한 내용을 해당 동영상 시청으로 확인하시기 바랍니다.
동영상 게시일: 2025-03-23
동영상 링크: 유튜브 영상 보러가기