在Email中搜寻相关的内容,是一个相对来说比较冷门的应用。来自Google Research的Michael Bendersky、Xuanhui Wang、Marc Najork和Donald Metzler在WSDM 2022上举办了一个关于Search and Discovery in Personal Email Collections的讲座(GitHub上搜索bendersky/sdpe-tutorial)。这个讲座涵盖了邮件搜索的一些基本的概念和系统架构,以及这个应用有什么有别于一般的搜索问题的挑战。在这个讲座中,我们也可以了解到哪一些想法应用到了Gmail这个可以算是全球最大的Email搜索应用中。
这个讲座从另一个方面来说,是一个很好的具体领域搜索问题的典范。很多领域都有自己的搜索问题,而我们往往能够做的就是把普适的网页搜索给应用到这个领域。但是,直接把网页搜索应用到其他领域可能会有很多问题。这个讲座其实可以看做是把网页搜索应用到特定领域的蓝本。
这个讲座从另一个方面来说,是一个很好的具体领域搜索问题的典范。很多领域都有自己的搜索问题,而我们往往能够做的就是把普适的网页搜索给应用到这个领域。但是,直接把网页搜索应用到其他领域可能会有很多问题。这个讲座其实可以看做是把网页搜索应用到特定领域的蓝本。
#AMiner今日论文推荐#
]第15届国际互联网搜索与数据挖掘大会(WSDM),清华大学计算机系的研究团队的工作——“Learning Discrete Representations via Constrained Clustering for Effective and Efficient Dense Retrieval”获得「最佳论文奖」!恭喜:https://t.cn/A66voVfw
此外,获得「时间检验奖」的是香港中文大学,相关工作为——“Recommender Systems with Social Regularization”!恭喜:https://t.cn/A66voVfZ
这是自大会创办以来,中国科研团队首次获得该奖项![打call]
#中国科技被低估了吗# #数据挖掘# #互联网[超话]# #清华大学[超话]# #香港中文大学[超话]#
]第15届国际互联网搜索与数据挖掘大会(WSDM),清华大学计算机系的研究团队的工作——“Learning Discrete Representations via Constrained Clustering for Effective and Efficient Dense Retrieval”获得「最佳论文奖」!恭喜:https://t.cn/A66voVfw
此外,获得「时间检验奖」的是香港中文大学,相关工作为——“Recommender Systems with Social Regularization”!恭喜:https://t.cn/A66voVfZ
这是自大会创办以来,中国科研团队首次获得该奖项![打call]
#中国科技被低估了吗# #数据挖掘# #互联网[超话]# #清华大学[超话]# #香港中文大学[超话]#
WSDM 2022 Challenge - Temporal Link Prediction
搞了一次与赛题博弈的比赛,每每都打破常识。还好最后一周发现了问题所在,推倒重来,模型非常简单,但却是冠军。
想必各路大佬打的也心累,在坑里难跳出来。
感谢队友们,抱紧大腿!
心路历程:
1. 验证集效果提了,模型有效
2. 这验证集效果怎么和中期测试集效果没相关性,不能相信验证集
3. 这中期测试集怎么不论怎么试都没效果
4. RandomWalk LINE 怎么这么强
5. KE 模型怎么也这么强
6. 研究一波 LINE,没发现长处,LINE embedding 加到模型效果增益后还没有 LINE 强
7. 搞不动了,推倒重写 baseline
8. 有效了
9. 调参,加特征
10. 冠军 https://t.cn/z80w2Db
搞了一次与赛题博弈的比赛,每每都打破常识。还好最后一周发现了问题所在,推倒重来,模型非常简单,但却是冠军。
想必各路大佬打的也心累,在坑里难跳出来。
感谢队友们,抱紧大腿!
心路历程:
1. 验证集效果提了,模型有效
2. 这验证集效果怎么和中期测试集效果没相关性,不能相信验证集
3. 这中期测试集怎么不论怎么试都没效果
4. RandomWalk LINE 怎么这么强
5. KE 模型怎么也这么强
6. 研究一波 LINE,没发现长处,LINE embedding 加到模型效果增益后还没有 LINE 强
7. 搞不动了,推倒重写 baseline
8. 有效了
9. 调参,加特征
10. 冠军 https://t.cn/z80w2Db
✋热门推荐