Esperando depósito en garantía

Instalación de chat de voz (Node.js + Openai + Google Tts) a precio accesible

Publicado el 05 Junio, 2025 en Programación y Tecnología

Sobre este proyecto

Abierto

Quiero desarrollar un chat de voz conversacional que te permita brindar información específica de la empresa para incorporarlo a la web. Que puedas conversar sobre los productos y servicios que ofrecemos. No es necesario crear un avatar en video.

Contexto general del proyecto

Hola, estoy buscando a alguien que me ayude a dejar en marcha un pequeño prototipo de chat por voz con música de fondo (similar a la función de voz de la app de ChatGPT). No soy empresa grande: solo quiero un setup funcional, rápido y económico para que pueda usarlo en un servidor (Ubuntu o similar). ¿Qué necesito que hagas? Configurar el backend (Node.js + Express): Clonar o recibir mi carpeta con server.js, package.json, public/index.html y la música de fondo (fondo.mp3). Instalar dependencias (npm install dotenv express cors openai @google-cloud/text-to-speech). Crear/configurar archivo .env con OPENAI_API_KEY y GOOGLE_APPLICATION_CREDENTIALS (ruta al JSON de credenciales de Google Cloud). Probar (mediante curl o Postman) que el endpoint POST /api/chat reciba { message: "texto" } y devuelva un MP3 con la respuesta de ChatGPT + Text-to-Speech. Ajustar el frontend (public/index.html): Verificar que use la Web Speech API para transcribir la voz en el navegador (Chrome o Edge). Que al “escuchar” una frase final, haga fetch("/api/chat") enviando el texto transcrito. Mezclar la respuesta de audio (TTS) con la pista de fondo mediante WebAudio (música en bucle a volumen bajo + voz del asistente). Corregir la URL del fetch si fuese necesario (por ejemplo, apuntar a http://localhost:3000/api/chat o a tu dominio final). Despliegue en servidor Linux (Ubuntu 18/20/22): Subir todo el proyecto al servidor (puede ser DigitalOcean, AWS EC2, Linode, etc.). Configurar Nginx (o Apache) para servir la carpeta public/ como sitio web estático y redirigir /api/chat al backend Node.js (puede ser mediante proxy pass). Configurar HTTPS con Let’s Encrypt (certbot) para que el dominio (o subdominio) quede con SSL válido. Asegurarte de que al entrar a https://tudominio.com funcione el botón de “Comenzar Conversación” y se despliegue el chat de voz sin errores. Pequeña documentación de uso: Un README sencillo que explique: Cómo clonar el repositorio e instalar dependencias. Dónde colocar la clave de OpenAI y el JSON de Google en .env. Comandos para levantar el servidor (npm start, o mediante pm2 o systemd). Cómo renovar el certificado HTTPS (certbot). Habilidades y experiencia deseada Conocimiento práctico de Node.js (v16+) y Express. Experiencia integrando la Openai api (gpt-3.5 o GPT-4). Conocimiento de Google Cloud Text-to-Speech (creación de cliente en Node.js). Manejo de Web Speech API (SpeechRecognition) y WebAudio API en el frontend. Experiencia desplegando apps en servidor Linux (Ubuntu), configuración de Nginx o Apache, y HTTPS/Let’s Encrypt. Ideal (pero no imprescindible): haber hecho proyectos similares de chat por voz o asistentes conversacionales. ¿Qué ofrezco y cómo trabajo? Presupuesto ajustado: No necesito un desarrollo complejo ni un contrato a largo plazo. Mi idea es pagar un monto razonable, ajustado a un proyecto pequeño. Si tu propuesta es muy cara, no seguiré adelante. Por eso, por favor indica un costo total o un rango aproximado (ej. “USD 150–250 para todo el trabajo”). Ambiente informal: No soy empresa grande: solo alguien con un proyecto personal/al pequeño emprendimiento. Prefiero comunicación directa, mensajes cortos y acordar objetivos claros. Entrega rápida: Me vendría bien tener todo funcionando en menos de dos semanas. Si puedes, indícame tu tiempo estimado de trabajo (en horas o días). Pago seguro: Podemos usar PayPal, transferencia bancaria o plataformas de freelancer (Workana, Upwork, etc.); Lo importante es que estés cómodo. ¿Cómo postularte? Presenta tu experiencia breve: Un párrafo corto sobre proyectos similares (GitHub, enlaces o descripciones). Si ya tienes algo funcionando en tu portfolio con Web Speech API o integraciones de OpenAI/Google TTS, ¡mejor! Presupuesto y tiempo: Indica cuánto cobrarías por todo el trabajo (o un estimado por hora y horas aproximadas). Dime en cuántos días o semanas podrías entregarlo listo. Comunicación: Háblame en español. Prefiero que coordinemos por e-mail o WhatsApp (lo que te quede más cómodo).

Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Pequeño
¿Es un proyecto o una posición? Un proyecto
Disponibilidad requerida Según se necesite

Plazo de Entrega: 30 Junio, 2025