Merge branch 'main' of github.com:Monadical-SAS/reflector into feat-sharing

2025-12-21 04:39:06 +00:00 · 2023-11-22 19:28:45 +01:00
parent 4226428f58 0e5c0f66d9
commit 2212d440d4
10 changed files with 515 additions and 104 deletions
--- a/server/reflector/db/transcripts.py
+++ b/server/reflector/db/transcripts.py
@@ -11,6 +11,7 @@ from pydantic import BaseModel, Field
 from reflector.db import database, metadata
 from reflector.processors.types import Word as ProcessorWord
 from reflector.settings import settings
+from reflector.storage import Storage

 transcripts = sqlalchemy.Table(
    "transcript",
@@ -28,6 +29,12 @@ transcripts = sqlalchemy.Table(
    sqlalchemy.Column("events", sqlalchemy.JSON),
    sqlalchemy.Column("source_language", sqlalchemy.String, nullable=True),
    sqlalchemy.Column("target_language", sqlalchemy.String, nullable=True),
+    sqlalchemy.Column(
+        "audio_location",
+        sqlalchemy.String,
+        nullable=False,
+        server_default="local",
+    ),
    # with user attached, optional
    sqlalchemy.Column("user_id", sqlalchemy.String),
    sqlalchemy.Column(
@@ -39,15 +46,22 @@ transcripts = sqlalchemy.Table(
 )


-def generate_uuid4():
+def generate_uuid4() -> str:
    return str(uuid4())


-def generate_transcript_name():
+def generate_transcript_name() -> str:
    now = datetime.utcnow()
    return f"Transcript {now.strftime('%Y-%m-%d %H:%M:%S')}"


+def get_storage() -> Storage:
+    return Storage.get_instance(
+        name=settings.TRANSCRIPT_STORAGE_BACKEND,
+        settings_prefix="TRANSCRIPT_STORAGE_",
+    )
+
+
 class AudioWaveform(BaseModel):
    data: list[float]

@@ -114,6 +128,7 @@ class Transcript(BaseModel):
    source_language: str = "en"
    target_language: str = "en"
    share_mode: Literal["private", "semi-private", "public"] = "private"
+    audio_location: str = "local"

    def add_event(self, event: str, data: BaseModel) -> TranscriptEvent:
        ev = TranscriptEvent(event=event, data=data.model_dump())
@@ -140,6 +155,10 @@ class Transcript(BaseModel):
    def data_path(self):
        return Path(settings.DATA_DIR) / self.id

+    @property
+    def audio_wav_filename(self):
+        return self.data_path / "audio.wav"
+
    @property
    def audio_mp3_filename(self):
        return self.data_path / "audio.mp3"
@@ -148,6 +167,10 @@ class Transcript(BaseModel):
    def audio_waveform_filename(self):
        return self.data_path / "audio.json"

+    @property
+    def storage_audio_path(self):
+        return f"{self.id}/audio.mp3"
+
    @property
    def audio_waveform(self):
        try:
@@ -160,6 +183,40 @@ class Transcript(BaseModel):

        return AudioWaveform(data=data)

+    async def get_audio_url(self) -> str:
+        if self.audio_location == "local":
+            return self._generate_local_audio_link()
+        elif self.audio_location == "storage":
+            return await self._generate_storage_audio_link()
+        raise Exception(f"Unknown audio location {self.audio_location}")
+
+    async def _generate_storage_audio_link(self) -> str:
+        return await get_storage().get_file_url(self.storage_audio_path)
+
+    def _generate_local_audio_link(self) -> str:
+        # we need to create an url to be used for diarization
+        # we can't use the audio_mp3_filename because it's not accessible
+        # from the diarization processor
+        from datetime import timedelta
+
+        from reflector.app import app
+        from reflector.views.transcripts import create_access_token
+
+        path = app.url_path_for(
+            "transcript_get_audio_mp3",
+            transcript_id=self.id,
+        )
+        url = f"{settings.BASE_URL}{path}"
+        if self.user_id:
+            # we pass token only if the user_id is set
+            # otherwise, the audio is public
+            token = create_access_token(
+                {"sub": self.user_id},
+                expires_delta=timedelta(minutes=15),
+            )
+            url += f"?token={token}"
+        return url
+

 class TranscriptController:
    async def get_all(
@@ -336,5 +393,22 @@ class TranscriptController:
        transcript.upsert_topic(topic)
        await self.update(transcript, {"topics": transcript.topics_dump()})

+    async def move_mp3_to_storage(self, transcript: Transcript):
+        """
+        Move mp3 file to storage
+        """
+
+        # store the audio on external storage
+        await get_storage().put_file(
+            transcript.storage_audio_path,
+            transcript.audio_mp3_filename.read_bytes(),
+        )
+
+        # indicate on the transcript that the audio is now on storage
+        await self.update(transcript, {"audio_location": "storage"})
+
+        # unlink the local file
+        transcript.audio_mp3_filename.unlink(missing_ok=True)
+

 transcripts_controller = TranscriptController()