个人能微调一个特定医疗领域的大语言模型吗

我在海外念物理治疗学的PhD,老板想让我跟大语言模型靠靠。我发现有一些开源的英文模型如Llama2,如果要将它在一个特定的医疗领域内进行微调(如治疗膝痛),训练它相关的治疗知识和处理思路,这个工作量会有多大呢?需要多少数据量来微调呢?是个人能完成的吗,还是得大团队?

有了解的旁友可以讲解一下?我无偿提供关于颈腰膝痛等问题的面诊评估和自我管理思路,欢迎私信和视频会诊。

像“治疗膝痛”这么细分的领域的话,比较容易确定找语料库的关键字,可以通过关键字或者期刊列表去爬数据的,爬多少数据够呢,微调的话,一部分高质量的语料库就够了,如果是重新训练,建议爬的越多越好,这是第一步,数据获取。

模型的架构是开源的,所以微调或者重训都有现成代码,参数小改即可。

物理资源:这一块是最关键的,如果从头训,最好找大实验室租借一段时间服务器资源(主要是GPU),微调的话,把参数调小,2-8张3090绝对是够了,当然,得保证内存足够,在实例化的时候需要加载很大的语料库的。

这么细小的领域,不需要大团队,一个人几个月就搞定了。

这个主要看几个,第一个你有没有高质量并且数量很大的训练数据,第二个是你的硬件是否足够。目前来讲,你要跑一个小的大模型是可以但是如果结果差强人意,没有什么意义。

每一次解答都是一次用心理解的过程,期望对你有所帮助。
参考结合AI智能库,如有帮助,恭请采纳。

是的,工作量很大,个人完成这项工作非常困难和耗时,不仅要大量的计算资源和专业知识。最好是借助大团队来实现。
1、需要准备大量的与治疗膝痛相关的的高质量数据集。这些数据可以包括文本、图像、视频等,以便模型能够学习到有关膝痛治疗的各个方面。具体的数据量需求取决于模型的复杂度和训练所需的时间。
2、需要具备相应的计算资源,以便进行大规模的训练和推理。这需要高性能计算机或云计算服务,以便在合理的时间内完成训练过程。
3、需要具备相应的技术和经验,以便编写训练代码并对模型进行微调。这需要掌握一些深度学习框架,如TensorFlow或PyTorch等。

个人是可以对特定医疗领域的大语言模型进行微调的。微调的关键在于拥有高质量且数量庞大的训练数据,并且需要足够的硬件支持。目前已经有一些医学领域的大语言模型进行了微调,例如谷歌的Med-PaLM2模型,在医学领域的问答任务上取得了很好的成果。此外,还有其他的大型语言模型可供使用,如悟道模型和CPM系列模型,它们涵盖了中文和中英双语的多个领域。因此,如果您有足够的训练数据和硬件支持,你可以微调一个特定医疗领域的大语言模型,以满足您的需求

img

img


专业领域可以做知识库,可以有效保护数据 http://t.csdn.cn/5KnMo  
不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 这有个类似的问题, 你可以参考下: https://ask.csdn.net/questions/7482362
  • 除此之外, 这篇博客: 自然语言处理相关问题总结中的 给定两个命名实体识别任务,一个任务数据量足够,另外一个数据量很少,可以怎么做? 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
    • 动机:NER 标注数据 有些类别 标注数据量 较少;
    • 方法:
      • 重采样
      • loss惩罚
      • Dice loss
      • 若 该类实体属于 长尾实体(填充率低),可以挖掘相关规则模板、构建词典库

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^