用深度学习做文本分类,需要多大的样本量?准备自己构建数据集,正负样本比例最大不能大于多少?

自己构建数据集,所有想知道最低样本量,还有正负样本比例可能会失衡,所有比例最大是多少?

这个不可一概而论。看你是在什么场景下分类,如果是特定的一些内容,比如用户简单的评价做正面负面分类,很少的样本就可以了。
如果要在自然语境中无限的分类,那么就需要很大的样本。
另外和你的模型、模型的参数/超参数、由此得到的模型的泛化能力也有关,和你的优化算法也有关。