fix: improve AI coach chat context, 128k window, and output limits

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-06-11 00:35:01 +08:00
parent 6977bce64f
commit 0e2e360ccf
6 changed files with 124 additions and 25 deletions
@@ -5,7 +5,13 @@ from typing import Any, Optional

 from hub_ai.attachments import parse_chat_attachments
 from hub_ai.client import generate_text, model_label
-from hub_ai.config import CHAT_MAX_HISTORY_TURNS, CHAT_TEMPERATURE
+from hub_ai.config import (
+    CHAT_CONTEXT_MAX_CHARS,
+    CHAT_MAX_HISTORY_TURNS,
+    CHAT_MAX_OUTPUT_TOKENS,
+    CHAT_SUMMARY_EXCERPT_MAX_CHARS,
+    CHAT_TEMPERATURE,
+)
 from hub_ai.context import build_daily_context, format_chat_context_for_chat
 from hub_ai.prompts import CHAT_SYSTEM, build_chat_user_prompt
 from hub_ai.store import (
@@ -81,8 +87,8 @@ def send_chat_message(
        attachments=parsed.get("attachment_meta") or [],
    )

-    brief_ctx = format_chat_context_for_chat(ctx)
-    excerpt = summary_excerpt_for_chat(day)
+    brief_ctx = format_chat_context_for_chat(ctx, max_chars=CHAT_CONTEXT_MAX_CHARS)
+    excerpt = summary_excerpt_for_chat(day, max_chars=CHAT_SUMMARY_EXCERPT_MAX_CHARS)

    user_prompt = build_chat_user_prompt(
        context_text=brief_ctx,
@@ -100,6 +106,7 @@ def send_chat_message(
        user=user_prompt,
        temperature=CHAT_TEMPERATURE,
        images_b64=parsed.get("images_b64") or None,
+        max_tokens=CHAT_MAX_OUTPUT_TOKENS,
    )
    if reply.startswith("AI 调用失败"):
        return {"ok": False, "msg": reply, "session_id": sid}
@@ -22,6 +22,12 @@ def generate_text(
    user: str,
    temperature: float,
    images_b64: Optional[Sequence[str]] = None,
+    max_tokens: int | None = None,
 ) -> str:
    prompt = f"{system.strip()}\n\n---\n\n{user.strip()}"
-    return ai_generate(prompt, temperature=temperature, images_b64=images_b64)
+    return ai_generate(
+        prompt,
+        temperature=temperature,
+        images_b64=images_b64,
+        max_tokens=max_tokens,
+    )
@@ -7,7 +7,10 @@ HUB_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))

 SUMMARY_TEMPERATURE = 0.15
 CHAT_TEMPERATURE = 0.5
-CHAT_MAX_HISTORY_TURNS = 20
+CHAT_MAX_HISTORY_TURNS = 40
+CHAT_MAX_OUTPUT_TOKENS = 2048
+CHAT_CONTEXT_MAX_CHARS = 128_000
+CHAT_SUMMARY_EXCERPT_MAX_CHARS = 8000
 SUMMARY_RETENTION_DAYS = 90
 CHAT_SESSION_RETENTION_DAYS = 60
 FUND_HISTORY_DAYS = 180
@@ -9,7 +9,13 @@ from typing import Any, Optional

 import httpx

-from hub_ai.config import FUND_HISTORY_DAYS, hub_agent_timeout, hub_flask_timeout, trading_day_reset_hour
+from hub_ai.config import (
+    CHAT_CONTEXT_MAX_CHARS,
+    FUND_HISTORY_DAYS,
+    hub_agent_timeout,
+    hub_flask_timeout,
+    trading_day_reset_hour,
+)
 from hub_ai.fund_history import format_fund_history_text, get_fund_history, record_fund_snapshot
 from hub_trades_lib import current_trading_day, summarize_trades

@@ -706,15 +712,71 @@ def format_chat_position_overview(payload: dict) -> str:
    return "\n".join(lines)


-def format_chat_context_for_chat(payload: dict, max_chars: int = 5200) -> str:
+def format_chat_context_slim(payload: dict) -> str:
+    """聊天专用：不含 180 日资金曲线与昨日平仓明细，避免挤占对话上下文。"""
+    totals = payload.get("totals") or {}
+    day = totals.get("trading_day")
+    lines = [
+        f"【今日合计 {day}】平仓盈亏 {totals.get('total_pnl_u')}U | "
+        f"笔数 {totals.get('closed_count')}（胜{totals.get('win_count')}/负{totals.get('loss_count')}）| "
+        f"实盘持仓 {totals.get('open_position_count', 0)} 仓 | 浮盈亏 {totals.get('float_pnl_u')}U",
+        "【说明】持仓=交易所实盘；趋势/关键位/监控单=本地计划，不等于已开仓。",
+    ]
+    for ac in payload.get("accounts") or []:
+        if ac.get("status") == "未监控":
+            lines.append(f"- {ac.get('name')}：未监控")
+            continue
+        st = ac.get("trade_stats") or {}
+        open_n = int(ac.get("open_position_count") or _account_open_position_count(ac))
+        pos_txt = "空仓" if open_n <= 0 else f"{open_n}仓 浮盈亏{ac.get('float_pnl_u')}U"
+        mc = _monitor_counts(ac)
+        mon = []
+        if mc["trends"]:
+            mon.append(f"趋势{mc['trends']}")
+        if mc["rolls"]:
+            mon.append(f"加仓{mc['rolls']}")
+        if mc["keys"]:
+            mon.append(f"关键位{mc['keys']}")
+        if mc["orders"]:
+            mon.append(f"监控单{mc['orders']}")
+        mon_txt = f"；监控 {'/'.join(mon)}" if mon else ""
+        lines.append(
+            f"- {ac.get('name')}：{pos_txt} | 今日盈亏{st.get('total_pnl_u')}U "
+            f"({st.get('closed_count')}笔) | 资金{_fmt_fund(ac.get('funding_usdt'))} "
+            f"交易{_fmt_fund(ac.get('trading_usdt'))}{mon_txt}"
+        )
+        trades = ac.get("trades") or []
+        if trades:
+            for t in trades[:4]:
+                lines.append(f"    · {_format_trade_line(t)}")
+            if len(trades) > 4:
+                lines.append(f"    · …共{len(trades)}笔今日平仓")
+        positions = ac.get("positions") or []
+        for p in positions[:4]:
+            if not isinstance(p, dict):
+                continue
+            sym = p.get("symbol") or "?"
+            side = p.get("side") or "?"
+            upnl = _position_float_pnl(p)
+            lines.append(f"    · 持仓 {sym} {side} 浮盈亏{upnl:.4f}U")
+    return "\n".join(lines)
+
+
+def format_chat_context_for_chat(
+    payload: dict,
+    max_chars: int = CHAT_CONTEXT_MAX_CHARS,
+) -> str:
    overview = format_chat_position_overview(payload)
-    body = format_context_text(payload)
+    body = str(payload.get("text") or "").strip() or format_context_text(payload)
    text = overview + "\n\n" + body
    if len(text) <= max_chars:
        return text
-    budget = max(800, max_chars - len(overview) - 4)
-    return overview + "\n\n" + body[:budget].rstrip() + "..."
+    budget = max(2000, max_chars - len(overview) - 4)
+    return overview + "\n\n" + body[:budget].rstrip() + "…"


-def format_chat_context_brief(payload: dict, max_chars: int = 4500) -> str:
+def format_chat_context_brief(
+    payload: dict,
+    max_chars: int = CHAT_CONTEXT_MAX_CHARS,
+) -> str:
    return format_chat_context_for_chat(payload, max_chars=max_chars)
@@ -49,6 +49,9 @@ CHAT_SYSTEM = """
 - 用户口述与快照冲突时，以快照为准并口语说明「我这边看到是空仓/有N仓」。
 - 若附带「今日总结摘要」，那是较早生成的缓存，**实盘持仓以【当前多账户快照】里的「实盘持仓总览」为准**，摘要里若提到持仓可能已过时。
 - 若用户上传图片，可结合图中可见信息讨论，看不清的明确说看不清。
+- **优先接住【用户现在说】和【此前对话】**：用户聊心态、悔单、某笔操作时，先顺着这个话题回应，不要每句都复述账户资金数字。
+- **接续对话**：有【此前对话】时须接着聊，不要重复开场白，回复写完整，不要说到一半戛然而止。
+- 快照里的盈亏/资金仅在需要核对事实时引用；用户口述与快照冲突时，以快照为准并口语说明。
 """.strip()


@@ -71,19 +74,19 @@ def build_chat_user_prompt(
    user_message: str,
    attachment_note: str = "",
 ) -> str:
-    parts = [
-        f"【交易日】{trading_day}",
-        "【当前多账户快照（含实盘持仓与本地监控，发送时已刷新）】",
+    parts = [f"【交易日】{trading_day}"]
+    if history_lines.strip():
+        parts.extend(["【此前对话（须接续，勿重复开场）】", history_lines.strip()])
+    parts.extend([
+        "【当前多账户快照（事实参考；持仓以「实盘持仓总览」为准）】",
        context_text.strip() or "（无监控数据）",
-    ]
+    ])
    if summary_excerpt.strip():
        parts.extend([
-            "【今日总结摘要（可能滞后，持仓以快照「实盘持仓总览」为准）】",
+            "【今日总结摘要（可能滞后，持仓以快照为准）】",
            summary_excerpt.strip(),
        ])
-    if history_lines.strip():
-        parts.extend(["【此前对话】", history_lines.strip()])
    if attachment_note.strip():
        parts.extend(["【用户附件说明】", attachment_note.strip()])
-    parts.extend(["【用户现在说】", user_message.strip()])
+    parts.extend(["【用户现在说（优先回应这一条）】", user_message.strip()])
    return "\n\n".join(parts)