最新发布第27页
排序
【人工智能】无归一化的Transformer
论文作者团队提出用动态双曲正切(DyT)替代Transformer中的归一化层。传统观点认为归一化层(如Layer Norm)对模型稳定性至关重要,但作者发现其核心作用是通过类tanh的非线性压缩极端值。DyT...
【日常】近期放慢博客更新速度2
最近迎来期末考试月了,感觉大二上一直在忙,但是到期末课程依旧不会,麻了。 9月份刚开始一直在忙社团招新,忙到11月下旬才算招新结束。上半学期也一直在跟着老师做科研开组会,到了12月又在备...
【阅读】荣格八维认知过程专业解析(转载侵删,仅供学习参考)
本文探讨了MBTI类型学中的认知过程,强调了每个人都可以通过有意识的努力发展各种认知过程,但重点在于这些过程是否像用惯用手写字那样自然。文章详细解释了Se(外倾感觉)、Si(内倾感觉)、Ne...
【人工智能】【Python】各种评估指标,PR曲线,ROC曲线,过采样,欠采样(Scikit-Learn实践)
本文介绍了使用Python和Scikit-Learn进行信用卡欺诈检测的完整流程。通过处理高度不平衡的数据集(492例欺诈 vs 284315正常),采用SMOTE过采样技术平衡样本,并使用决策树模型训练。评估部分涵...
【C】生成指定区间的随机数
我分享了在C语言中生成指定区间随机数的方法。首先,我需要使用srand(time(NULL))来初始化随机数种子。然后,利用rand()函数会生成0到RAND_MAX之间整数的特性,通过取模运算和加法来实现区间的...
【Linux】screen工具用于保持会话功能
文章介绍了在Linux系统中使用screen工具保持SSH会话的常用命令。通过启动新会话、为会话命名、分离会话、查看当前会话、重新连接会话以及退出会话等操作,用户可以有效地管理多个会话,避免因SS...










































