文章标签

PyTorch

Volcano Gang Scheduling 机制详解：All-or-Nothing 分配策略在分布式训练中的死锁预防与资源碎片优化实践

分布式训练的“调度噩梦”：为什么默认 K8s 调度器不够用？在大规模语言模型或视觉多模态训练中，数据并行（DDP）、张量并行（TP）与流水线并行（PP）已成为标配。这类任务具有一个致命特征：强同步屏障。以 PyTorch DDP...

2026/4/12 0 117 0 0 0 云原生AI调度 Volcano机制分布式训练优化
AI 模型性能测试：从入门到精通，教你玩转模型评估

AI 模型性能测试：从入门到精通，教你玩转模型评估在人工智能领域，模型的性能测试至关重要。它可以帮助我们了解模型在实际应用中的表现，并根据测试结果不断优化模型，提高其准确性和效率。本文将带你深入了解 AI 模型性能测试，从入门到精通...

2024/10/23 0 1814 0 0 0 人工智能机器学习模型评估
嵌入式异构多核处理器上语音识别：实时推理与内存占用的深度优化策略

在当下这个万物互联的时代，语音识别技术已经不再是科幻电影里的情节，它正悄然渗透进我们生活的方方面面：智能音箱、车载系统、可穿戴设备……它们无不依赖于边缘侧强大的语音处理能力。然而，在嵌入式系统中实现高性能、低功耗的语音识别，尤其是在资源受...

2025/8/6 0 225 0 0 0 嵌入式AI 语音识别异构计算
告别手输验证码：复杂验证码自动识别的破局思路与实用工具

网站验证码，简直是自动化脚本的一大拦路虎！尤其是现在，各种花式验证码层出不穷，什么扭曲的文字、奇怪的图形，甚至还有行为验证码，手动输入简直是浪费生命。作为一名追求效率的程序员，咱必须想办法让程序自动搞定这些烦人的验证码。一、验证码...

2025/6/29 0 464 0 0 0 验证码识别自动化脚本深度学习
深入NUMA：边缘AI轻量级模型内存访问模式评估与性能调优实战

在当下AI无处不在的浪潮中，将大型模型“瘦身”后下放到边缘设备，进行实时、低延迟的推理，已经成为一股不可逆的趋势。我们把这些经过剪枝（Pruning）或蒸馏（Distillation）处理的“轻量级大模型”部署到资源有限的边缘服务器或特定...

2025/7/29 0 447 0 0 0 NUMA优化边缘AI 内存访问
EWC算法实战：在线广告推荐系统中的持续学习

你是否遇到过这样的困境：训练好的机器学习模型，在面对新数据时，性能急剧下降？这就是“灾难性遗忘”问题。在在线广告推荐这类场景下，数据是持续不断产生的，模型需要不断学习新知识。而 Elastic Weight Consolidation (...

2025/3/26 0 242 0 0 0 EWC 持续学习推荐系统
EWC算法实战：部署、优化与性能监控全攻略

“灾难性遗忘”一直是深度学习领域，尤其是涉及持续学习（Continual Learning）场景时的一大难题。想象一下，你训练了一个模型来识别猫，然后又用它来识别狗，结果模型完全忘记了怎么识别猫！Elastic Weight Consol...

2025/3/26 0 554 0 0 0 EWC 持续学习深度学习
cgroups 限制 Linux 共享内存 shm 防止 OOM 攻击实战

在多租户环境、容器云平台或向外提供公共 API 服务的 Linux 主机上，共享内存（Shared Memory，简称 shm）常常是一个容易被安全人员忽略的资源漏洞。由于默认情况下 POSIX 共享内存（挂载在 /dev/shm...

2026/6/13 0 22 0 0 0 Linux cgroups 安全防御
RISC-V平台轻量级Transformer模型极致能效推理：RVV、BFloat16与稀疏化的深度融合

在资源受限的RISC-V平台上部署轻量级Transformer模型，实现极致的能效比推理，是一项极具挑战但又充满吸引力的任务。本文将深入探讨如何结合RISC-V向量扩展（RVV）、低精度浮点运算（如bfloat16）和稀疏化技术，在有限的...

2025/7/27 0 409 0 0 0 RISC-V Transformer BFloat16
DBSCAN + LSTM：金融时间序列分析的实战指南

在金融领域，时间序列分析是预测市场走势、管理风险和制定投资策略的关键。随着大数据时代的到来，金融时间序列数据的规模和复杂性都在迅速增长。传统的分析方法往往难以有效处理这些复杂数据，而DBSCAN（基于密度的噪声空间聚类）和LSTM（长短期...

2025/3/26 0 723 0 0 0 DBSCAN LSTM 金融时间序列
边缘计算联邦学习：聚合算法选择与优化指南

在边缘计算环境中部署联邦学习，选择合适的聚合算法至关重要。边缘计算的特性，如资源受限、网络不稳定、数据异构性等，对联邦学习的性能和效果产生显著影响。本文将深入探讨在边缘计算场景下，如何选择和优化联邦学习的聚合算法，并提供一些实用的建议。 ...

2025/7/24 0 408 0 0 0 边缘计算联邦学习聚合算法
Serverless架构未来：Serverless容器与AI的融合之路

Serverless架构未来：Serverless容器与AI的融合之路 Serverless，一个曾经被视为“无服务器”的架构，如今已成为云计算领域不可忽视的力量。它允许开发者专注于编写和部署代码，而无需关心底层服务器的管理和维护。这...

2025/6/6 0 2065 0 0 0 Serverless容器 Serverless AI Serverless架构
工业物联网边缘AI异常检测：低功耗高效模型训练与部署实战指南

在瞬息万变的工业生产环境中，机器故障或异常行为往往会导致巨大的经济损失和安全隐患。传统的异常检测方式，比如依赖人工巡检或中心化云端分析，时效性与实时性都难以满足工业4.0时代的需求。将人工智能的能力下沉到工业物联网（IIoT）的边缘侧，实...

2025/8/4 0 613 0 0 0 工业物联网边缘计算异常检测
联邦学习：边缘AI隐私保护与协同训练的实践指南

联邦学习：如何在边缘设备上实现隐私保护的协同智能？作为一名AI工程师，我深知在日益普及的边缘设备上部署智能模型的迫切性，以及随之而来的数据隐私挑战。传统的集中式模型训练模式，需要将所有用户数据汇集到中心服务器，这在数据敏感性日益增强...

2025/9/27 0 336 0 0 0 联邦学习边缘AI 数据隐私
突破瓶颈：GIS与时间序列数据融合建模实践指南

在数据科学的实践中，我们常常会遇到这样一种情境：单一模态的数据，无论是结构化的表格数据还是非结构化的文本、图像，其蕴含的信息量总是有限的。当面对需要理解复杂系统（如智慧城市、环境监测、物流优化）的问题时，传统的表格数据建模方法往往会触及瓶...

2025/9/26 0 283 0 0 0 数据融合 GIS 时间序列
GPR与深度学习的强强联合：混合模型构建策略

GPR与深度学习的强强联合：混合模型构建策略各位技术爱好者，今天咱们来聊聊高斯过程回归（Gaussian Process Regression，GPR）和深度学习这对“黄金搭档”的组合拳。GPR作为一种强大的贝叶斯非参数模型，自带不...

2025/3/25 0 544 0 0 0 高斯过程深度学习贝叶斯优化
开源工具，如何玩转深度学习？

开源工具，如何玩转深度学习？深度学习，这个近年来火爆的领域，吸引了无数开发者和研究者的目光。但对于很多初学者来说，接触深度学习的门槛似乎很高，需要学习复杂的数学知识和编程技巧，还要面对昂贵的硬件设备。其实，想要入门深度学习，并...

2024/11/15 0 277 0 0 0 深度学习开源工具机器学习
AI视觉检测：多模型推理服务异构集成与高效管理实践

在现代AI视觉检测系统中，集成来自不同供应商的深度学习模型已成为常态。然而，这些模型通常是“黑盒”，高度依赖特定框架（如TensorFlow、PyTorch）且拥有各自复杂的依赖关系，给在统一生产线上高效、稳定地运行和管理带来巨大挑战。如...

2025/10/4 0 261 0 0 0 AI推理模型部署 MLOps
Kubernetes上百个深度学习模型的高效生命周期管理实践

将深度学习模型从物理机迁移到Kubernetes集群，以解决资源碎片化和部署效率低下，这无疑是一个正确的战略方向。然而，正如您团队目前所面临的，如何高效管理上百个、由不同团队开发、采用不同框架的模型生命周期，确实是对CI/CD流程和自动化...

2025/10/5 0 195 0 0 0 MLOps Kubernetes 深度学习部署
深度学习框架中的自动混合精度训练优势

在当今的人工智能和深度学习领域，随着数据集规模和复杂性的增加，传统的全精度（FP32）训练方法面临着计算资源不足的问题。为了应对这一挑战，自动混合精度（AMP）技术应运而生，它允许我们在保持高模型准确率的同时，提高计算效率。什么是自...

2024/8/7 0 309 0 0 0 深度学习自动混合精度机器学习

文章标签

PyTorch

Volcano Gang Scheduling 机制详解：All-or-Nothing 分配策略在分布式训练中的死锁预防与资源碎片优化实践

AI 模型性能测试：从入门到精通，教你玩转模型评估

嵌入式异构多核处理器上语音识别：实时推理与内存占用的深度优化策略

告别手输验证码：复杂验证码自动识别的破局思路与实用工具

深入NUMA：边缘AI轻量级模型内存访问模式评估与性能调优实战

EWC算法实战：在线广告推荐系统中的持续学习

EWC算法实战：部署、优化与性能监控全攻略

cgroups 限制 Linux 共享内存 shm 防止 OOM 攻击实战

RISC-V平台轻量级Transformer模型极致能效推理：RVV、BFloat16与稀疏化的深度融合

DBSCAN + LSTM：金融时间序列分析的实战指南

边缘计算联邦学习：聚合算法选择与优化指南

Serverless架构未来：Serverless容器与AI的融合之路

工业物联网边缘AI异常检测：低功耗高效模型训练与部署实战指南

联邦学习：边缘AI隐私保护与协同训练的实践指南

突破瓶颈：GIS与时间序列数据融合建模实践指南

GPR与深度学习的强强联合：混合模型构建策略

开源工具，如何玩转深度学习？

AI视觉检测：多模型推理服务异构集成与高效管理实践

Kubernetes上百个深度学习模型的高效生命周期管理实践

深度学习框架中的自动混合精度训练优势