- PyTorch量化感知训练技术:模型压缩与高精度边缘部署实践
- ChronosX: 可使用外生变量的时间序列预测基础模型
- PyTorchVideo实战:从零开始构建高效视频分类模型
- 在AMD GPU上部署AI大模型:从ROCm环境搭建到Ollama本地推理实战指南
- 防止交叉验证中的数据泄露:提升模型在实际环境中的性能
- Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
- 加速LLM大模型推理,KV缓存技术详解与PyTorch实现
- 零训练成本优化LLM: 11种LLM权重合并策略原理与MergeKit实战配置
- NoProp:无需反向传播,基于去噪原理的非全局梯度传播神经网络训练,可大幅降低内存消耗
- GenPRM:思维链+代码验证,通过生成式推理的过程奖励让大模型推理准确率显著提升
- PyTabKit:比sklearn更强大的表格数据机器学习框架
- SecMulti-RAG:兼顾数据安全与智能检索的多源RAG框架,为企业构建不泄密的智能搜索引擎
- CLIMB自举框架:基于语义聚类的迭代数据混合优化及其在LLM预训练中的应用
- 10招立竿见影的PyTorch性能优化技巧:让模型训练速度翻倍
- SmolVLM:资源受限环境下的高效多模态模型研究与实现