压缩算法为大语言模型“瘦身”
发布时间:2024-11-23 10:37来源:中国网阅读量:5141
压缩算法为大语言模型“瘦身”
据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。
团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。
CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。
虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。
团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。
不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。
声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。
- 瓜子二手车王晓宇:新能源二手车市场将释放巨大发展潜
- 第一届贵阳大数据科创城创新创意应用大赛暨2024年
- 因保障品质消费获得年轻人喜爱和信任得物App入选“
- 第七届中国国际进口博览会2024长三角G60科创走
- 做专属咖啡人的咖啡品牌Peet’s皮爷咖啡的底气来
- 贵州省第三届美丽乡村篮球联赛半决赛黔东南赛区暨黔东
- 宁夏全域土地综合整治“点土成金”激活乡村振兴新动能
- 聚焦新质生产力与产业国际竞争力提升2024年上海产
- dss+全球首席执行官戴维德:中国的可持续性发展给
- 如何以智能技术赋能单元教学?徐汇区这样做
- 泰州姜堰区淤溪镇开展“‘淤’爱同行温暖秋冬+1℃”
- 长三角文博会开幕首日上海城市IP计划发布