العودة إلى المدونة
مساعد صوتيتعرف على الكلامTTSدليل تعليمي

بناء مساعد صوتي بالذكاء الاصطناعي: من التعرف على الكلام إلى الاستجابة

212AY Team·2026-05-15·14 دقيقة
from gtts import gTTS
import pygame

def speak(text, lang='ar'):
    tts = gTTS(text=text, lang=lang)
    tts.save('response.mp3')
    
    pygame.mixer.init()
    pygame.mixer.music.load('response.mp3')
    pygame.mixer.music.play()
    while pygame.mixer.music.get_busy():
        continue

دعم متعدد اللغات

للمساعدات الصوتية بالعربية أو الفرنسية:

  • STT: Whisper يدعم 100+ لغة
  • NLU: GPT-4 يعمل بالعربية والفرنسية
  • TTS: Google TTS يدعم العربية والفرنسية

حالة استخدام واقعية: مساعد طبي

بنيت شركة ناشئة في مجال التكنولوجيا الصحية في الدار البيضاء مساعداً صوتياً بالدارجة لـ:

  • جدولة المواعيد
  • تذكير الأدوية
  • فرز الأعراض
  • المعلومات الصحية

يعالج المساعد 1,000+ مكالمة يومياً بالعربية المغربية.

النشر

  • استخدم WebSocket للتواصل في الوقت الفعلي
  • انشر STT على مثيلات GPU لزمن استجابة منخفض
  • خزّن الاستجابات الشائعة مؤقتاً للسرعة
  • راقب الدقة ورضا المستخدمين

الخطوات التالية

  • أضف كشف كلمة التنبيه ("مرحباً أيها المساعد")
  • طبق محادثات متعددة الجولات
  • أضف إجراءات مخصصة (إرسال بريد إلكتروني، التحكم في المنزل الذكي)
  • دعم التبديل بين اللغات

أحدث المقالات

كيف تبني روبوت محادثة ذكي لشركتك

دليل خطوة بخطوة لبناء ونشر روبوت محادثة ذكي مخصص لخدمة العملاء، وتوليد العملاء المحتملين، والدعم الداخلي.

بناء نظام RAG من الصفر: دليل عملي

دليل تطبيقي لبناء نظام توليد معزز بالاسترجاع باستخدام أدوات مفتوحة المصدر، مع أمثلة برمجية ونصائح للنشر.

الرؤية الحاسوبية للمبتدئين: بناء مصنف صور

دليل صديق للمبتدئين في الرؤية الحاسوبية، يغطي تصنيف الصور، واكتشاف الأشياء، وبناء أول تطبيق رؤية ذكاء اصطناعي.