LLM:大语言模型相关
准备
|
|
hf-mirror: hugging-faces镜像网站
hfd: 大模型数据下载工具
|
|
概念
GGUF:
- gguf:
ONNX: 开发神经网络交换格式
onnx: Open Neural Network Exchange,是一种模型IR,用于在各种深度学习训练和推理框架转换的一个中间表示格式。
用protobuf定义;
ONNX 模型结构:
ModelProto
- GraphProto
- NodeProto
- ValueInfoProto
- GraphProto
框架
RAG:
工具
llama-cli
ollama: 命令行运行llama工具
- 支持平台: mac, linux, windows
|
|
llamafile: 单文件大模型运行工具
- 支持平台: mac, linux, win
|
|
gpt4all
lm-studio
AnythingLLM
- 高效、可定制且开源的企业级文档聊天机器人解决方案;
- github: https://github.com/Mintplex-Labs/anything-llm
应用
Chat: 文本对话
语音识别
whisper.cpp
- 基于whispe.cpp语音对话模型;
- windows下wsl编译
|
|
TTS: 文本转语音
图片生成
2d转3d
知识系统
平台
Nvidia
CUDA
AMD
ZLUDA
- zluda: 是无修改直接在amd gpu上运行cuda程序的cuda兼容库;
|
|
- olive
|
|