Skip to main content

LLM FAQ

Pricing

Model1M input/outputnotes
gpt-4o5.00/5.00 / 15.00
o1-preview15.00/15.00 / 60.00
o1-mini3.00/3.00 / 12.00
gpt-4o-mini0.15/0.15 / 00.60
Gemini 1.5 Pro 128K3.5.00/3.5.00 / 10.50
Gemini 1.5 Flash 128K0.075/0.075 / 00.30
Gemini 1.5 Flash > 128K0.15/0.15 / 00.60
Gemini 1.5 {Flash/Pro}-00250%limits*2
Claude 3.5 Sonnet 200K3.00/3.00 / 15.00
Claude 3 Haiku 200K0.25/0.25 / 01.25
Anthropic Claude 3 Opus15.00/15.00 / 75.00
Groq Llama 3.1 70B Versatile 128k0.59/0.59 / 00.79
Groq Whisper V3 Large$0.111/h
DeepInfra Llama-3.1-70B-Instruct 128k0.35/0.35 / 0.40
DeepInfra Qwen2-72b 32k0.35/0.35 / 0.40
tip
  • 小模型里 gpt-4o-mini 目前是性价比最好的
  • 开源模型的速度可以非常快,能实现 multi agent 这种模式
  • Gemini 1.5 Flash 支持 1M context window
  • Gemini 1.5 Pro 支持 2M context window
apppricequota
ChatGPT Plus$204o 80/3h, 4 40/3h
ChatGPT Team25/年付,25/年付, 30/月付2*Plus

model metrics

  • 参数量
  • 非Embedding参数量
  • GQA
  • Tie Embedding
  • Context Window - 上下文长度
  • 语言支持度
  • Code Switch - 语言转换
    • 避免模型直接切换语言
  • Safety
  • 评测/Benchmark
    • MMLU
    • MMLU-Pro
    • GPQA
    • TheoremQA
    • BBH
    • HumanEval
    • MBPP
    • MultiPL-E
    • GSM8K
    • MATH
    • C-Eval
    • CMMLU
    • Multi-Exam
    • Multi-Understanding
    • Multi-Mathematics
  • 参考

structure

将用户提交的信息返回为如下 JSON 格式

```
{"fullName":"姓名","mobilePhone":"电话","address":"完整地址","province":"省","city":"市","zip":"邮编"}
```
陈小月 18421598413 四川省成都市武侯区天府大道中段666号
陈小月 18421598413 四川省 成都市 武侯区天府大道中段666号 610000

将用户提交的信息返回为如下 JSON 格式

```
{
"orderNumber":"订单号",
"companyName":"公司名称","capital":"注册资金",
"legalName":"法人名称","legalPhone":"法人电话",
"supervisorName":"监事名称","supervisorPhone":"监事电话",
"shareholders":[{"name":"股东名称","phone":"股东电话","ratio":"持股比例"}],
"scope":"经营范围"
}
```

- shareholders 为股东列表,尝试从上下文提取股东人员信息,如果没有股东则留空,如果强调了法人持股,则法人就是股东。
- ratio 为 number,没有百分号 `%`
订单号:2023123456789
公司名称:上海东东家政服务有限公司
注册资金:3万,法人持股100%
法人:姚丽,电话,19373380000,[email protected]
监事:唐强 13801234000
一般项目:家政服务;专业保洁、清洗、消毒服务;礼仪服务;

EF BF BD

format

  • GGUF
    • llama.cpp, August 21st 2023, 替代 GGML
  • GGML