add comments and log

2026-02-04 18:06:48 +00:00 · 2023-08-17 09:33:59 +05:30
parent eb13a7bd64
commit 2e48f89fdc
1 changed files with 10 additions and 7 deletions
--- a/server/gpu/modal/reflector_llm.py
+++ b/server/gpu/modal/reflector_llm.py
@@ -113,7 +113,9 @@ class LLM:
    @method()
    def generate(self, prompt: str, schema: str = None):
        print(f"Generate {prompt=}")
        # If a schema is given, conform to schema
        if schema:
            print(f"Schema {schema=}")
            import ast
            import jsonformer
@@ -123,16 +125,17 @@ class LLM:
                                                   prompt=prompt,
                                                   max_string_token_length=self.gen_cfg.max_new_tokens)
            response = jsonformer_llm()
-            print(f"Generated {response=}")
+        else:
-            return {"text": response}
+            # If no schema, perform prompt only generation
-        input_ids = self.tokenizer.encode(prompt, return_tensors="pt").to(
+            # tokenize prompt
            input_ids = self.tokenizer.encode(prompt, return_tensors="pt").to(
                self.model.device
-        )
+            )
-        output = self.model.generate(input_ids, generation_config=self.gen_cfg)
+            output = self.model.generate(input_ids, generation_config=self.gen_cfg)
-        # decode output
+            # decode output
-        response = self.tokenizer.decode(output[0].cpu(), skip_special_tokens=True)
+            response = self.tokenizer.decode(output[0].cpu(), skip_special_tokens=True)
        print(f"Generated {response=}")
        return {"text": response}