AstroResearch/.env.example
Asfmq 3f1935678b feat: LLM/Embedding 客户端模块化、侧边栏折叠交互、arXiv→ADS 下载回退与前端体验重构
**后端架构**
  - 抽取翻译服务中内嵌的 LLM HTTP 调用为独立的 LlmClient /
    EmbeddingClient(src/clients/llm.rs),翻译模块改为委托调用,消除
    对 reqwest/serde 的直接耦合
  - Config 新增 EMBEDDING_API_KEY/EMBEDDING_API_BASE/EMBEDDING_MODEL
    三项配置,默认 fallback 至 LLM 对应值,补齐向量嵌入基础设施

  **下载策略优化**
  - arXiv 直连下载失败后自动回退至 ADS 网关 PUB_PDF→EPRINT_PDF→CrossRef
    多级通道,替换此前单路径策略;批量同步同步应用此逻辑
  - PDF/HTML 任一方成功时,失败方的 path 字段不再存储 "error:" 报错字符串,
    改为置 NULL,防止日志污染数据

  **前端交互增强**
  - 侧边栏支持折叠/展开:收起为仅图标模式(w-16),展开恢复完整模式(w-64);
    收起后点击 Logo 展开,含流畅 cubic-bezier 过渡动画
  - 阅读面板新增 PDF 内嵌预览:已下载 PDF 时可通过 iframe 切换查看
    /api/files 下的本地文献
  - reader/citation 面板未选文献时展示带图标的空状态引导页,替代空白页
  - 文献详情面板改为固定高度弹性布局(h-[460px]),各区块按比例分配避免
    内容挤压;期刊名过长截断+悬停tooltip;关键词无数据显式占位
  - 全局移除 emoji Unicode,统一替换为 lucide-react 图标组件,
    消除跨平台字体渲染差异

  **反爬检测精细化**
  - 按响应长度分层:>150KB 跳过检测(完整文献),<5KB 才扫描通用 HTTP
    错误关键字,杜绝长文献误触 Cloudflare/503 模式匹配
  - 新增 Radware Bot Manager、ShieldSquare WAF 特征识别

  **健壮性**
  - Obscura 下载校验失败后自动清理硬盘残留坏文件
  - 健康检查工具:文献已有有效 HTML 但 PDF 字段为旧报错时自动判定可修复
  - 上传接口 body limit 提升至 100MB,新增 /api/files 静态文件服务路由
  - StandardPaper 新增 has_pdf/has_html 字段区分格式级下载状态
2026-06-13 11:11:33 +08:00

38 lines
1.2 KiB
Plaintext

# AstroResearch Configuration Template
# Copy this to .env and fill in your details
# NASA ADS API Key (Get from ui.adsabs.harvard.edu)
ADS_API_KEY=your_ads_api_key_here
# LLM Translation Provider Settings (OpenAI-compatible endpoints)
LLM_API_KEY=your_llm_api_key_here
LLM_API_BASE=https://api.deepseek.com/v1
# Examples: deepseek-chat, gpt-4o-mini, gemini-1.5-flash
LLM_MODEL=deepseek-chat
# Embedding Model Settings (OpenAI-compatible endpoints, falls back to LLM keys if unspecified)
EMBEDDING_API_KEY=your_embedding_api_key_here
EMBEDDING_API_BASE=https://api.openai.com/v1
EMBEDDING_MODEL=text-embedding-3-small
# Qiniu Cloud Storage Config (For hosting PDF-extracted layout images)
QINIU_AK=your_qiniu_access_key_here
QINIU_SK=your_qiniu_secret_key_here
QINIU_BUCKET=your_bucket_name
QINIU_DOMAIN=http://your_cdn_domain.com
# MinerU PDF Layout Extractor Remote API (If not using HTML)
MINERU_API_URL=http://mineru.remote-api.com/api/v1/extract
MINERU_API_KEY=your_mineru_api_key
# Local Data Paths
LIBRARY_DIR=./library
PORT=8000
DATABASE_URL=sqlite://astro_research.db
# Logging Configuration (Pretty console and rolling file logging)
LOG_LEVEL=info,astroresearch=debug
LOG_FORMAT=pretty
LOG_OUTPUTS=stdout,file
LOG_DIR=./logs