我在海外念物理治疗学的PhD,老板想让我跟大语言模型靠靠。我发现有一些开源的英文模型如Llama2,如果要将它在一个特定的医疗领域内进行微调(如治疗膝痛),训练它相关的治疗知识和处理思路,这个工作量会有多大呢?需要多少数据量来微调呢?是个人能完成的吗,还是得大团队?
有了解的旁友可以讲解一下?我无偿提供关于颈腰膝痛等问题的面诊评估和自我管理思路,欢迎私信和视频会诊。
像“治疗膝痛”这么细分的领域的话,比较容易确定找语料库的关键字,可以通过关键字或者期刊列表去爬数据的,爬多少数据够呢,微调的话,一部分高质量的语料库就够了,如果是重新训练,建议爬的越多越好,这是第一步,数据获取。
模型的架构是开源的,所以微调或者重训都有现成代码,参数小改即可。
物理资源:这一块是最关键的,如果从头训,最好找大实验室租借一段时间服务器资源(主要是GPU),微调的话,把参数调小,2-8张3090绝对是够了,当然,得保证内存足够,在实例化的时候需要加载很大的语料库的。
这么细小的领域,不需要大团队,一个人几个月就搞定了。
这个主要看几个,第一个你有没有高质量并且数量很大的训练数据,第二个是你的硬件是否足够。目前来讲,你要跑一个小的大模型是可以但是如果结果差强人意,没有什么意义。
每一次解答都是一次用心理解的过程,期望对你有所帮助。
参考结合AI智能库,如有帮助,恭请采纳。
是的,工作量很大,个人完成这项工作非常困难和耗时,不仅要大量的计算资源和专业知识。最好是借助大团队来实现。
1、需要准备大量的与治疗膝痛相关的的高质量数据集。这些数据可以包括文本、图像、视频等,以便模型能够学习到有关膝痛治疗的各个方面。具体的数据量需求取决于模型的复杂度和训练所需的时间。
2、需要具备相应的计算资源,以便进行大规模的训练和推理。这需要高性能计算机或云计算服务,以便在合理的时间内完成训练过程。
3、需要具备相应的技术和经验,以便编写训练代码并对模型进行微调。这需要掌握一些深度学习框架,如TensorFlow或PyTorch等。
个人是可以对特定医疗领域的大语言模型进行微调的。微调的关键在于拥有高质量且数量庞大的训练数据,并且需要足够的硬件支持。目前已经有一些医学领域的大语言模型进行了微调,例如谷歌的Med-PaLM2模型,在医学领域的问答任务上取得了很好的成果。此外,还有其他的大型语言模型可供使用,如悟道模型和CPM系列模型,它们涵盖了中文和中英双语的多个领域。因此,如果您有足够的训练数据和硬件支持,你可以微调一个特定医疗领域的大语言模型,以满足您的需求
专业领域可以做知识库,可以有效保护数据 http://t.csdn.cn/5KnMo
不知道你这个问题是否已经解决, 如果还没有解决的话: