大数据会推送感兴趣的内容,屏蔽掉不感兴趣的,缺少了对其他意识形态的对照反思,加深对本体意识形态的认可度,更加偏执的对待与自己有意识形态上差异的他人,激化人与人的矛盾。
如看了健身视频,推送增多为肌肉男女,看不起娘炮,柔弱的男性,男性的形象固化,雄性意识形态演变愈演愈烈,人类的发展可能性减少。这值得让人深思! https://t.cn/RyhH9Zs

#BBD即时资讯# 6月12日,清华大学五道口金融学院清华—康奈尔双学位金融MBA 2020级师生到访参观BBD,围绕大数据在资本市场的创新应用展开交流。

BBD董事长曾途介绍了公司基于丰富的数据资源、完善的分析技术、独立的数据动态本体平台和多维量化分析能力,精准发现和解决各行业痛点问题,用大数据支撑决策。

BBD资本市场业务负责人分享,资本市场作为直接融资的支撑体系,是经济高质量发展的“助推器”。国家推出一系列政策促进资本市场不断开放与发展,同时,也面临市场乱象频发等监管痛点。

BBD资本市场业务团队依托大数据、人工智能技术,对企业的全生命周期进行全面刻画和精准分析,以“五位一体”产品体系对接资本市场需求,产品场景全覆盖多空双向业务,实现风险的快速有效识别,助力资本市场数字化转型。目前,团队已长期服务于证监会、深交所等监管机构,并可助力资管机构挖掘优质企业、甄别问题企业,用新兴技术赋能传统资管业务,提高资管效率。

论法律大数据“领域”的构建
法治日报 2020-08-19
  □ 王禄生

  一、问题的提出:法律大数据“领域理论”的现状与不足

  (一)法律大数据领域本体论有待构建

  由于对法律大数据的领域本体论反思还较为缺乏,因此学界一般认为,法律大数据就是在法律领域中使用的具备“4V特征”的数据集。在实践中,出现了片面强调大体量、全样本、高速度、实时性、多种类的观点,甚至人为设定标准来固化地区分“大数据”与“小数据”,如PB量级才是法律大数据、没有全样本不是法律大数据等。实际上,“4V特征”并不完全适用于法律领域。因此,要推动法律大数据的研究与应用,必须构建法律大数据领域本体论,挖掘属于法律的“领域特征”。

  (二)法律大数据领域认识论有待更新

  由于缺乏对领域认识论的充分反思,当前法律大数据应用较多采取基于大数据分析的知识发现范式。具体而言,就是借助数据挖掘技术从大量判决书、案件卷宗等非结构化、半结构化数据中发现法律规律并加以应用的过程。此种认识论在大数据与大算力的支撑之下取得了一定的成效,但却与法律领域的特殊需求不完全匹配。这体现在:其一,演绎思维冲突;其二,因果思维冲突;其三,说理思维冲突。可见,为了避免在法律大数据应用中方法论与法律思维的冲突,就势必需要更新法律大数据领域认识论。

  (三)法律大数据领域方法论有待优化

  由于在本体论与认识论上套用了大数据的一般分析框架,当前法律大数据在方法论上表现为“通用技术+通用流程”的特点,也就是在数据获取、预处理、训练、解释、应用等的常见步骤中使用通用的大数据分析技术、算法与模型,没有考虑技术在法律领域的兼容性,更没有针对法律“领域知识壁垒”而进行专门的技术与流程优化。

  二、领域本体论的构建:法律大数据的“3A特征”

  (一)本体论视角下法律大数据概念的厘清

  “法律大数据”本体论的构建首先需要实现“法律领域中大数据”(big data in law)向“法律领域的大数据”(legal big data)转变。换言之,在本体论的视角下,“法律大数据”是指在立法、执法、司法等法律过程中形成或依法获取的,既在一定程度上具备大数据的通用特征,又满足适配性、正确性和易变性的领域需求,必须结合法律领域的特定算法与模型来实现辅助法律决策、优化法律过程目标的数据集。上述概念有三个关键点:其一,法律大数据是“领域大数据”而非“领域中的大数据”;其二,除了通用领域的部分特征之外,法律的特殊性使得法律大数据具有特定的领域特征;其三,法律大数据的领域特征决定了通用大数据分析工具也需要结合法律领域进行优化。

  (二)本体论视角下法律大数据的领域特征

  法律领域的特殊性决定了法律大数据除了部分具有通用大数据的“4V特征”之外,还具备从属于法律领域“3A特征”。

  第一,法律大数据的适配性(Adaptability)。与其他领域强调样本的“大与全”相比,法律大数据特别强调样本的适配性,而并不必然要求大量的全样本。第二,法律大数据的正确性(Accuracy)。在通用领域中,样本大数据质量的高低判断标准通常是纯技术的形式判断,比如数据缺失、数据重复、数据格式不统一等。一般而言,研发者并不需要对样本数据进行“对”与“错”的实质价值判断。与之形成鲜明对比的是,在法律领域中,作为各种算法训练基础的法院判决则很可能存在对错之分,法律大数据训练样本质量的高低判断除了借助技术逻辑进行形式审查之外,还需要依托专业逻辑——基于法学知识的专业判断。第三,法律大数据的易变性(Astability)。对于通用领域而言,数据的价值是相对稳定的,可以通过多次挖掘进行深度的运用,而对于法律领域而言,部分数据具有易变性,情境一经调整,原有数据将失去挖掘价值。

  三、领域认识论的更新:法律大数据的知识发现逻辑

  (一)“轻量级理论驱动”的法律大数据认识论

  大数据认识论排除理论预设、以数据分析为前置,相信只要拥有足够数据,数据本身就能够说明问题。然而,数据产生于更广泛的知识生产操作,每个学科都有自己数据想象的规范和标准,就像每个领域都有自己被接受的方法和实践的演进结构一样。完全脱离理论的大数据挖掘势必会在数据到结构化知识再到因果推断之间形成鸿沟。作为对原有大数据认识论的反思,科学界提出了“轻量级理论驱动”(lightweight theory-driven)的认识论,优化单纯以数据驱动的认识论。

  法学是社会科学的重要领域,具有鲜明的领域特殊性。考虑到通用大数据认识论与法律领域因果思维、演绎思维等方面的不相兼容性所造成的负面影响,结合法律领域特殊性的法律大数据认识论反思就显得至关重要。这就需要更新通用大数据数据驱动的经验主义认识论,构建结合法律领域特殊性的“轻量级理论驱动”法律大数据认识论,将法学理论结构映射到法律大数据的知识发现过程中。具体而言,可以从三个方面展开:首先,通过法学理论构建法学领域知识本体,明确法律大数据挖掘的结构、关系和边界;其次,通过法学理论确定适合特定目标的法律大数据子集;最后,将法学理论作为法律大数据挖掘结果的解释性框架。

  (二)新认识论驱动下的法律大数据知识发现逻辑

  在“轻量级理论驱动”的法律大数据认识论的指导下,法律大数据知识发现的逻辑也会产生相应的调整。“轻量级理论驱动”认识论指导下的法律大数据知识发现就是结合法学理论,对符合“3A特征”需求的法律大数据进行知识表示、知识抽取和知识输出的过程。具体而言,就是针对不同的主题(如类案推荐、办案证据辅助)进行知识本体构建,在知识本体构建的基础之上从各类大数据集抽取信息、训练模型、形成法律知识、装载到法律大数据仓库中并根据用户需求输出的过程。因此,法律大数据应用通常就是一个从某种法律数据中获取实质性的、有意义的知识(见解)的文本、数据挖掘过程。

  四、领域方法论的优化:法律大数据的知识壁垒及其应对

  法律大数据的“3A特征”以及“轻量级理论驱动”的知识发现方式相结合,形成了法律大数据在方法论上面临的“领域知识壁垒”。因此,在法律大数据“领域理论”的构建过程中,就必须充分了解“领域知识壁垒”的成因,进而有针对性地提出应对之策。

  (一)法律大数据“领域知识壁垒”的表现

  在技术进步话语所凸显的技术瓶颈之外,法律大数据分析的每个环节还面临明显的“领域知识壁垒”。

  首先,在法律知识表示中法律领域本体的构建需要大量法律专业知识的支撑。对此,我们可以从三个方面展开:其一,法律大数据的知识表示通常是在法律专家的知识之上建立的专家规则;其二,不同主题的知识本体有着不同程度的差异;其三,法律的领域本体还具有维度多、属性多、要素多的复杂性特点。

  其次,在法律知识发现的数据获取和数据标注环节也离不开专业知识。通用大数据领域,常人使用常识就可以实现高质量、高效率的样本标注。而在法律场景中,标注者不仅要有扎实的专业知识积累,还需要了解案件的整体事实和法律背景,从而做出准确的标注。更为重要的在于法律领域的标注还面临标准统一性的难题。不同标注人员,即使都具备深厚的法学专业知识,其对同一标注对象也可能会形成不同的判断。可见,法律领域的特殊性使得数据的获取难度和成本要大大高于通用场景。

  最后,在法律知识应用环节也存在着专业知识障碍。一方面,法律人,尤其是实务部门一线工作人员由于技术知识背景的缺乏,对技术逻辑十分陌生,不清楚技术能够解决哪些业务问题,也就无法向研发主体提出准确的大数据需求;另一方面,法律人提出的同案同判、财产保全风险预警等诸多业务需求对于技术人员而言也往往具有一定的理解障碍。横亘在法律大数据技术研发人员面前的鸿沟往往并非技术的瓶颈而恰恰可能是法律人的“常识”。

  (二)法律大数据“领域知识壁垒”的应对

  面对法律大数据的“领域知识壁垒”,需要在领域方法论上予以应对,通过推动法学与技术的有机融合,提升法律人在法律大数据研发中的地位。与此同时,结合法律大数据的领域特征,开展专有的法律大数据技术创新,而不是把法律大数据视作通用大数据技术在法律领域的平移运用。更为重要的还在于,要转变法学人才培养的模式,打造法律知识工程师的培养体系,以形成破除法律大数据“领域知识壁垒”的有生力量。


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 尽管只是这样一起玩了相当于一个季度,不过也很感谢那些朋友们,愿意找玩游戏又划水、又不爱开麦交流、又无聊又无趣的我玩 呜呜!一个猜想哈,不一定正确:咱就是说,会
  • #周翊然##周翊然# 《拳拳四重奏》饰肖千也[打call]《凤归四时歌》饰钟离[鼓掌]《拜托了班长》饰叶景希[彩虹屁]《你微笑时很美》饰艾佳[打call]《乔
  • 而后是樱的眼睛,清浅绿色眼瞳中倒映出身旁之人的蓝色,而佐助的披风上则也同样扫出了身旁之人的粉色(说到这里逐渐露出了笑容)(这就是作者亲自画染上你的颜色什么的吗(
  • “准精神病”则是以蔡海伦、马楠、万哥、马涛几人的某些几近精神病的性格表现作为分析对象:蔡海伦无论任何场合,都把女权挂在嘴边,把所有的话题都引向关于女权的争论;马
  • 在前期节目中没怎么凸显出来的郑秀妍,在这一期节目也终于开始显露自己的优势,本就是女团出身的郑秀妍唱跳水平的确在其他姐姐之上,也真正凭借着实力拉高了整个表演的
  • 像我就是想的多做得少的典型代表,随着体内脂肪率的上升,年轻时候的干劲越来越少了[允悲][允悲][允悲]#天官赐福漫画[超话]##天官赐福庆生月# 最喜欢哪一个花
  • 闲聊话语辩证论《伤官》二八字算命大师认为当一个八字格局没有食伤,缺少沟通,理解能力差,头脑不灵活,做事少思量男人身旺用财无食伤,对婚姻不理解,无浪漫,对老婆不包
  • #魏无羡 恣意洒脱#[微风] #魏无羡 可爱至极# mxtxfmdzsftgcf魔道祖师粉墨香铜臭粉天官赐福他这次倒不是有意夸张捣乱,外人的确难以在短时间内适应
  • 《大乘妙法莲华经》讲记-序品第一身心不动:这也是佛的示现。若于诸地波罗蜜多,善修出离,转依成满;是名如来法身之相。
  • 这一世,我雪月风花,阆风緤马,只为你,安享芳华。这一世,我轻狂疏言,如痴如癫,只为你,旧梦三年。
  • 相对于长大后的夏天,小时候的夏天似乎更让人难忘,那时的夏天属于夜晚,属于大蒲扇、星空和爷爷的故事,那时没有空调,电扇都很少,但是爷爷的蒲扇似乎有无穷的凉风,伴随
  • 答:以考生核酸检测阴性报告上“采样时间”为起始,计算至考生参加当次考试的首科考试开考时间为止,凡在48小时内的均符合要求。关于盘州市2022年事业单位公开招聘疫
  • 心怀国家发展,胸念黎民百姓,存有远大理想抱负,且能赋文作辞的屈大夫投江,给我们了一个很大的启发:欲让后世的人们在惦念中能有快乐,忘记忧患,忘掉忧伤和悲痛,今生末
  • 如果谁死了,我们就弹吉他欢送他……#双陈普洱[超话]# 我希望,年迈时能够住在一个小农场,有马有狗,养鹰种茶花。#茶道# 我希望,年迈时能够住在一个小农场,有
  • 报道中写道:"参赞和外长还讨论了美国和白罗斯即将进行的大使互访,并指出开放的沟通渠道对两国都有好处"。只能被内地top校 手握一作的大神按在
  • 在询问现场施工负责人后方才知晓,此处林地已被永久征占,施工单位为红池实业有限公司,早已将林地征占补偿资金汇给了田坝镇ZF,村民立即与ZF取得联系,咨询究竟是怎么
  • 对于失眠的人,漫长的夜生活才刚刚开始……#梦中的那片海杀青# 由新湃传媒、西嘻影业联合出品的《梦中的那片海》杀青,网络平台已定腾讯视频全网独播,咱就是说鹅好有钱
  • 11、#北京增7例本土感染者#,社会面无新增病例12、#保安19楼系布条悬空踹18楼窗救火# ,小区业主表示很感动13、安徽合肥,#上百名老人投资墓地被骗超65
  • 无论何时何地,只要我做的,你们一定力挺我、鼓舞我[给力][赞啊]。影片给我的感觉很多,有一条呢就是拥有的时候请珍惜彼此,还有许多许多。
  • 童生曰:说得也是,徒儿自从吃了恩师之丹丸后,身上总是『热气腾腾』冷风再怎么吹亦不受影响,真是受用。)罪魂曰:痛死我也,早知『阿鼻地狱』那么苦,我也不敢造此大逆不