Spaces:

DroolingPanda
/

teachingAssistant

Sleeping

App Files Files Community

Michael Hu commited on Jul 29

Commit

6514731

1 Parent(s): ca57c53

fix dia tts

Browse files

Files changed (10) hide show

pyproject.toml +1 -0
src/application/services/audio_processing_service.py +1 -1
src/infrastructure/base/file_utils.py +1 -1
src/infrastructure/base/stt_provider_base.py +1 -1
src/infrastructure/base/translation_provider_base.py +1 -1
src/infrastructure/base/tts_provider_base.py +1 -1
src/infrastructure/config/container_setup.py +3 -3
src/infrastructure/config/dependency_container.py +11 -4
src/infrastructure/tts/cosyvoice2_provider.py +4 -4
src/infrastructure/tts/provider_factory.py +23 -8

pyproject.toml CHANGED Viewed

@@ -26,6 +26,7 @@ dependencies = [
     "phonemizer-fork>=3.3.2",
     "nemo_toolkit[asr]",
     "faster-whisper>=1.1.1",
 ]
 [project.optional-dependencies]

     "phonemizer-fork>=3.3.2",
     "nemo_toolkit[asr]",
     "faster-whisper>=1.1.1",
+    "descript-audio-codec"
 ]
 [project.optional-dependencies]

src/application/services/audio_processing_service.py CHANGED Viewed

@@ -571,7 +571,7 @@ class AudioProcessingApplicationService:
             return output_path
         except Exception as e:
-            logger.error(f"TTS failed: {e} [correlation_id={correlation_id}]", exc_info=True)
             raise SpeechSynthesisException(f"Speech synthesis failed: {str(e)}")
     def _get_error_code_from_exception(self, exception: Exception) -> str:

             return output_path
         except Exception as e:
+            logger.error(f"TTS failed: {e} [correlation_id={correlation_id}]", exception=e)
             raise SpeechSynthesisException(f"Speech synthesis failed: {str(e)}")
     def _get_error_code_from_exception(self, exception: Exception) -> str:

src/infrastructure/base/file_utils.py CHANGED Viewed

@@ -356,7 +356,7 @@ class ErrorHandler:
             error_msg += f" during {context}"
         error_msg += f": {str(error)}"
-        self.logger.error(error_msg, exc_info=True)
         if reraise_as:
             raise reraise_as(error_msg) from error

             error_msg += f" during {context}"
         error_msg += f": {str(error)}"
+        self.logger.error(error_msg, exception=error)
         if reraise_as:
             raise reraise_as(error_msg) from error

src/infrastructure/base/stt_provider_base.py CHANGED Viewed

@@ -312,5 +312,5 @@ class STTProviderBase(ISpeechRecognitionService, ABC):
             error_msg += f" during {context}"
         error_msg += f": {str(error)}"
-        logger.error(error_msg, exc_info=True)
         raise SpeechRecognitionException(error_msg) from error

             error_msg += f" during {context}"
         error_msg += f": {str(error)}"
+        logger.error(error_msg, exception=error)
         raise SpeechRecognitionException(error_msg) from error

src/infrastructure/base/translation_provider_base.py CHANGED Viewed

@@ -315,7 +315,7 @@ class TranslationProviderBase(ITranslationService, ABC):
             error_msg += f" during {context}"
         error_msg += f": {str(error)}"
-        logger.error(error_msg, exc_info=True)
         raise TranslationFailedException(error_msg) from error
     def set_chunk_size(self, chunk_size: int) -> None:

             error_msg += f" during {context}"
         error_msg += f": {str(error)}"
+        logger.error(error_msg, exception=error)
         raise TranslationFailedException(error_msg) from error
     def set_chunk_size(self, chunk_size: int) -> None:

src/infrastructure/base/tts_provider_base.py CHANGED Viewed

@@ -340,5 +340,5 @@ class TTSProviderBase(ISpeechSynthesisService, ABC):
             error_msg += f" during {context}"
         error_msg += f": {str(error)}"
-        logger.error(error_msg, exc_info=True)
         raise SpeechSynthesisException(error_msg) from error

             error_msg += f" during {context}"
         error_msg += f": {str(error)}"
+        logger.error(error_msg, exception=error)
         raise SpeechSynthesisException(error_msg) from error

src/infrastructure/config/container_setup.py CHANGED Viewed

@@ -280,7 +280,7 @@ def create_configured_container(config_file: Optional[str] = None) -> Dependency
             _validate_container_setup(container)
             logger.info("Container validation completed")
         except Exception as validation_error:
-            logger.error(f"Container validation failed: {validation_error}", exc_info=True)
             # For now, let's continue even if validation fails to see if the app works
             logger.warning("Continuing despite validation failure...")
@@ -288,7 +288,7 @@ def create_configured_container(config_file: Optional[str] = None) -> Dependency
         return container
     except Exception as e:
-        logger.error(f"Failed to create configured container: {e}", exc_info=True)
         raise
@@ -352,7 +352,7 @@ def _validate_container_setup(container: DependencyContainer) -> None:
     except Exception as e:
         error_msg = f"Container validation failed during service resolution: {e}"
-        logger.error(error_msg, exc_info=True)
         raise RuntimeError(error_msg)

             _validate_container_setup(container)
             logger.info("Container validation completed")
         except Exception as validation_error:
+            logger.error(f"Container validation failed: {validation_error}", exception=validation_error)
             # For now, let's continue even if validation fails to see if the app works
             logger.warning("Continuing despite validation failure...")
         return container
     except Exception as e:
+        logger.error(f"Failed to create configured container: {e}", exception=e)
         raise
     except Exception as e:
         error_msg = f"Container validation failed during service resolution: {e}"
+        logger.error(error_msg, exception=e)
         raise RuntimeError(error_msg)

src/infrastructure/config/dependency_container.py CHANGED Viewed

@@ -214,7 +214,7 @@ class DependencyContainer:
                     return result
             except Exception as e:
-                logger.error(f"Failed to resolve service {service_type.__name__}: {e}", exc_info=True)
                 raise
     def _create_singleton(self, service_type: Type[T], descriptor: ServiceDescriptor) -> T:
@@ -260,7 +260,7 @@ class DependencyContainer:
                 logger.info(f"Factory function completed for {descriptor.service_type.__name__}")
                 return result
             except Exception as e:
-                logger.error(f"Factory function failed for {descriptor.service_type.__name__}: {e}", exc_info=True)
                 raise
         # If implementation is a class
@@ -271,7 +271,7 @@ class DependencyContainer:
                 logger.info(f"Class instantiation completed for {descriptor.service_type.__name__}")
                 return result
             except Exception as e:
-                logger.error(f"Class instantiation failed for {descriptor.service_type.__name__}: {e}", exc_info=True)
                 raise
         logger.error(f"Invalid implementation type for {descriptor.service_type.__name__}: {type(implementation)}")
@@ -312,7 +312,14 @@ class DependencyContainer:
         factory = self.resolve(TTSProviderFactory)
         if provider_name:
-            return factory.create_provider(provider_name, **kwargs)
         else:
             preferred_providers = self._config.tts.preferred_providers
             return factory.get_provider_with_fallback(preferred_providers, **kwargs)

                     return result
             except Exception as e:
+                logger.error(f"Failed to resolve service {service_type.__name__}: {e}", exception=e)
                 raise
     def _create_singleton(self, service_type: Type[T], descriptor: ServiceDescriptor) -> T:
                 logger.info(f"Factory function completed for {descriptor.service_type.__name__}")
                 return result
             except Exception as e:
+                logger.error(f"Factory function failed for {descriptor.service_type.__name__}: {e}", exception=e)
                 raise
         # If implementation is a class
                 logger.info(f"Class instantiation completed for {descriptor.service_type.__name__}")
                 return result
             except Exception as e:
+                logger.error(f"Class instantiation failed for {descriptor.service_type.__name__}: {e}", exception=e)
                 raise
         logger.error(f"Invalid implementation type for {descriptor.service_type.__name__}: {type(implementation)}")
         factory = self.resolve(TTSProviderFactory)
         if provider_name:
+            try:
+                return factory.create_provider(provider_name, **kwargs)
+            except Exception as e:
+                logger.warning(f"Failed to create specific TTS provider {provider_name}: {e}")
+                logger.info("Falling back to default provider selection")
+                # Fall back to default provider selection
+                preferred_providers = self._config.tts.preferred_providers
+                return factory.get_provider_with_fallback(preferred_providers, **kwargs)
         else:
             preferred_providers = self._config.tts.preferred_providers
             return factory.get_provider_with_fallback(preferred_providers, **kwargs)

src/infrastructure/tts/cosyvoice2_provider.py CHANGED Viewed

@@ -61,13 +61,13 @@ class CosyVoice2TTSProvider(TTSProviderBase):
                 self.model = CosyVoice('pretrained_models/CosyVoice-300M')
                 logger.info("CosyVoice2 model successfully loaded")
             except ImportError as e:
-                logger.error(f"Failed to import CosyVoice2 dependencies: {str(e)}", exc_info=True)
                 self.model = None
             except FileNotFoundError as e:
-                logger.error(f"Failed to load CosyVoice2 model files: {str(e)}", exc_info=True)
                 self.model = None
             except Exception as e:
-                logger.error(f"Failed to initialize CosyVoice2 model: {str(e)}", exc_info=True)
                 self.model = None
         model_available = self.model is not None
@@ -144,7 +144,7 @@ class CosyVoice2TTSProvider(TTSProviderBase):
             return audio_bytes, DEFAULT_SAMPLE_RATE
         except Exception as e:
-            logger.error(f"CosyVoice2 audio generation failed: {str(e)}", exc_info=True)
             self._handle_provider_error(e, "audio generation")
     def _generate_audio_stream(self, request: 'SpeechSynthesisRequest') -> Iterator[tuple[bytes, int, bool]]:

                 self.model = CosyVoice('pretrained_models/CosyVoice-300M')
                 logger.info("CosyVoice2 model successfully loaded")
             except ImportError as e:
+                logger.error(f"Failed to import CosyVoice2 dependencies: {str(e)}", exception=e)
                 self.model = None
             except FileNotFoundError as e:
+                logger.error(f"Failed to load CosyVoice2 model files: {str(e)}", exception=e)
                 self.model = None
             except Exception as e:
+                logger.error(f"Failed to initialize CosyVoice2 model: {str(e)}", exception=e)
                 self.model = None
         model_available = self.model is not None
             return audio_bytes, DEFAULT_SAMPLE_RATE
         except Exception as e:
+            logger.error(f"CosyVoice2 audio generation failed: {str(e)}", exception=e)
             self._handle_provider_error(e, "audio generation")
     def _generate_audio_stream(self, request: 'SpeechSynthesisRequest') -> Iterator[tuple[bytes, int, bool]]:

src/infrastructure/tts/provider_factory.py CHANGED Viewed

@@ -20,7 +20,7 @@ class TTSProviderFactory:
     def _register_default_providers(self):
         """Register all available TTS providers."""
         # Import providers dynamically to avoid import errors if dependencies are missing
         # Always register dummy provider as fallback
         from .dummy_provider import DummyTTSProvider
         self._providers['dummy'] = DummyTTSProvider
@@ -39,7 +39,16 @@ class TTSProviderFactory:
             self._providers['dia'] = DiaTTSProvider
             logger.info("Registered Dia TTS provider")
         except ImportError as e:
-            logger.debug(f"Dia TTS provider not available: {e}")
         # Try to register CosyVoice2 provider
         try:
@@ -68,10 +77,10 @@ class TTSProviderFactory:
                 # Check if provider is available
                 if self._provider_instances[name].is_available():
                     available.append(name)
             except Exception as e:
                 logger.warning(f"Failed to check availability of {name} provider: {e}")
         return available
     def create_provider(self, provider_name: str, **kwargs) -> TTSProviderBase:
@@ -94,9 +103,15 @@ class TTSProviderFactory:
                 f"Unknown TTS provider: {provider_name}. Available providers: {available}"
             )
         try:
             provider_class = self._providers[provider_name]
             # Create instance with appropriate parameters
             if provider_name in ['kokoro', 'dia', 'cosyvoice2']:
                 lang_code = kwargs.get('lang_code', 'z')
@@ -133,7 +148,7 @@ class TTSProviderFactory:
             preferred_providers = ['kokoro', 'dia', 'cosyvoice2', 'dummy']
         available_providers = self.get_available_providers()
         # Try preferred providers in order
         for provider_name in preferred_providers:
             if provider_name in available_providers:
@@ -177,7 +192,7 @@ class TTSProviderFactory:
                     self._provider_instances[provider_name] = provider_class()
             provider = self._provider_instances[provider_name]
             return {
                 "available": provider.is_available(),
                 "name": provider.provider_name,
@@ -199,6 +214,6 @@ class TTSProviderFactory:
                     provider._cleanup_temp_files()
             except Exception as e:
                 logger.warning(f"Failed to cleanup provider {provider.provider_name}: {e}")
         self._provider_instances.clear()
         logger.info("Cleaned up TTS provider instances")

     def _register_default_providers(self):
         """Register all available TTS providers."""
         # Import providers dynamically to avoid import errors if dependencies are missing
         # Always register dummy provider as fallback
         from .dummy_provider import DummyTTSProvider
         self._providers['dummy'] = DummyTTSProvider
             self._providers['dia'] = DiaTTSProvider
             logger.info("Registered Dia TTS provider")
         except ImportError as e:
+            logger.warning(f"Dia TTS provider not available: {e}")
+            # Still register it so it can attempt installation later
+            try:
+                from .dia_provider import DiaTTSProvider
+                self._providers['dia'] = DiaTTSProvider
+                logger.info("Registered Dia TTS provider (dependencies may be installed on demand)")
+            except Exception:
+                logger.warning("Failed to register Dia TTS provider")
+        except Exception as e:
+            logger.warning(f"Failed to register Dia TTS provider: {e}")
         # Try to register CosyVoice2 provider
         try:
                 # Check if provider is available
                 if self._provider_instances[name].is_available():
                     available.append(name)
             except Exception as e:
                 logger.warning(f"Failed to check availability of {name} provider: {e}")
         return available
     def create_provider(self, provider_name: str, **kwargs) -> TTSProviderBase:
                 f"Unknown TTS provider: {provider_name}. Available providers: {available}"
             )
+        # Check if provider is actually available before creating
+        available_providers = self.get_available_providers()
+        if provider_name not in available_providers:
+            logger.warning(f"TTS provider {provider_name} is registered but not available")
+            raise SpeechSynthesisException(f"TTS provider {provider_name} is not available")
         try:
             provider_class = self._providers[provider_name]
             # Create instance with appropriate parameters
             if provider_name in ['kokoro', 'dia', 'cosyvoice2']:
                 lang_code = kwargs.get('lang_code', 'z')
             preferred_providers = ['kokoro', 'dia', 'cosyvoice2', 'dummy']
         available_providers = self.get_available_providers()
         # Try preferred providers in order
         for provider_name in preferred_providers:
             if provider_name in available_providers:
                     self._provider_instances[provider_name] = provider_class()
             provider = self._provider_instances[provider_name]
             return {
                 "available": provider.is_available(),
                 "name": provider.provider_name,
                     provider._cleanup_temp_files()
             except Exception as e:
                 logger.warning(f"Failed to cleanup provider {provider.provider_name}: {e}")
         self._provider_instances.clear()
         logger.info("Cleaned up TTS provider instances")