聊天机器人,cb

1.训练数据

tsv文件格式

训练数据示例如下:

呵呵    是王若猫的。
不是    那是什么?
怎么了  我很难过,安慰我~
开心点哈,一切都会好起来 嗯 会的
我还喜欢她,怎么办       我帮你告诉她?发短信还是打电话?
短信    嗯嗯。我也相信
你知道谁么      肯定不是我,是阮德培
许兵是谁        吴院四班小帅哥

2.使用示例

训练

from lightnlp.tg import CB

cb_model = CB()

train_path = '/home/lightsmile/NLP/corpus/chatbot/chat.train.sample.tsv'
dev_path = '/home/lightsmile/NLP/corpus/chatbot/chat.test.sample.tsv'
vec_path = '/home/lightsmile/NLP/embedding/word/sgns.zhihu.bigram-char'

cb_model.train(train_path, vectors_path=vec_path, dev_path=train_path, save_path='./cb_saves')

测试

cb_model.load('./cb_saves')

cb_model.test(train_path)

预测

print(cb_model.predict('我还喜欢她,怎么办'))
print(cb_model.predict('怎么了'))
print(cb_model.predict('开心一点'))

预测结果为:

('我你告诉她?发短信还是打电话?', 0.8164891742422521)
('我难过,安慰我', 0.5596837521537591)
('嗯会的', 0.595637918475396)