keras 训练 IMDB数据 为什么预测的是正面情感?

学习 利用Keras中的IMDB数据集,对评论进行二分类,有个疑问是:为什么预测的是正面情感?代码如下:
from keras.datasets import imdb
from keras import models
from keras import layers
import numpy as np
import matplotlib.pyplot as plt

def vectorize_sequences(sequences, dimension=10000):
results = np.zeros((len(sequences), dimension))
for i, sequence in enumerate(sequences):
results[i, sequence] = 1.
print('i=',i,'results[i]=',results[i])
return results

(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)

'''word_index = imdb.get_word_index()
reverse_word_index = dict([(value, key) for (key, value) in word_index.items()])
decoded_review = ' '.join([reverse_word_index.get(i - 3, '?') for i in train_data[0]])
'''

x_train = vectorize_sequences(train_data)
x_test = vectorize_sequences(test_data)

y_train = np.asarray(train_labels).astype('float32')
y_test = np.asarray(test_labels).astype('float32')

model = models.Sequential()
model.add(layers.Dense(16, activation='relu', input_shape=(10000,)))
model.add(layers.Dense(16,activation='relu'))
model.add(layers.Dense(1,activation='sigmoid'))

x_val = x_train[:10000]
partial_x_train = x_train[10000:]

y_val = y_train[:10000]
partial_y_train = y_train[10000:]

model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])

history = model.fit(partial_x_train, partial_y_train, epochs=20, batch_size=512,validation_data=(x_val, y_val))

history_dict = history.history
loss_value = history_dict['loss']
val_loss_value = history_dict['val_loss']

epochs = range(1,len(loss_value)+1)

plt.plot(epochs, loss_value, 'bo', label='Trianing Loss')
plt.plot(epochs, val_loss_value, 'b', label='Validation Loss')
plt.title('Training and validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()

你的问题是什么,是你所有分类都分到postive去了么?还是什么,看下你的训练数据、验证数据是否一致,还有你的标记是否正确。
你的loss画出来是什么样的。

输出一个值,可以代表对于 正面(positive) 或 负面(negative) 的概率,比如 大于 0.5 就是正面, 小于 0.5 就是负面,所以对两种
结果(正面 或 负面) 输出一个值是足够的。 跟输入的编码关系不大,不管是用 one-hot还是用什么,因为关键是对于整个的输入数据集,
都是用同样的编码方式,所以是对所有输入都做了一致的处理就好,至于这种处理的效果如何,就是看预测的准确率有多高了,因为你是有
正确答案(labels)用来衡量结果集的准确率的。 imdb情感并不是只能用 deep learning比如 cnn, rnn (lstm), 也可以用svm来做的。 如果
只有两种结果 (positive 和 negative),用svm反而可以更快的得到更高的准确率。deep learning很多教科书都是数学比较差的人写的,
所以表达上经常无法把一些简单的概念解释清楚,而只能给读者掉掉书袋,整整他们自己都不太理解的概念。