refactor: Remove maxTokens from LLMCompletionRequest and related usages

2026-04-06 00:32:12 +02:00 · 2025-12-16 11:21:47 +00:00
parent 091a766c29
commit 5eca1a5d04
1 changed files with 0 additions and 4 deletions
--- a/Common/Server/Utils/LLM/LLMService.ts
+++ b/Common/Server/Utils/LLM/LLMService.ts
@@ -15,7 +15,6 @@ export interface LLMMessage {

 export interface LLMCompletionRequest {
  messages: Array<LLMMessage>;
-  maxTokens?: number;
  temperature?: number;
  llmProviderConfig: LLMProviderConfig;
 }
@@ -80,7 +79,6 @@ export default class LLMService {
              content: msg.content,
            };
          }),
-          max_tokens: request.maxTokens || 4096,
          temperature: request.temperature ?? 0.7,
        },
        headers: {
@@ -154,7 +152,6 @@ export default class LLMService {
    const requestData: JSONObject = {
      model: modelName,
      messages: userMessages,
-      max_tokens: request.maxTokens || 4096,
      temperature: request.temperature ?? 0.7,
    };

@@ -244,7 +241,6 @@ export default class LLMService {
          stream: false,
          options: {
            temperature: request.temperature ?? 0.7,
-            num_predict: request.maxTokens || 4096,
          },
        },
        headers: {