搜狗实验室进一步数据需求征集 188 days ago Read More
搜狗实验室依托搜狗搜索技术研发能力和海量数据获取能力,搜狐矩阵的互联网资源,清华-搜狐搜索技术联合实验室面向产业界的研究工作,自2006年11月成立以来一直致力于推动互联网相关技术(中文处理技术、搜索引擎技术和多媒体处理技术等)发展。我们的目标是将搜狗实验室发展成为一个提供相关技术数据资源和效果评测的平台。
搜狗实验室先后提供了互联网语料库、网页链接关系库、用户查询日志等海量、真实的数据资...
SogouT互联网语料库v3.0发布 71 days ago Read More
为推动中文互联网信息检索、数据挖掘方面的研究,清华—搜狐搜索技术联合实验室近期推出了SogouT互联网语料库,欢迎各位学者在互联网和自然语言处理相关研究中使用。 SogouT语料库收集了超过1.3亿网页数据,总存储规模达到5TB以上。除了包括所有的网页原始数据外,还包括了提取出的这部分网页之间的链接关系数据,以及PageRank数值数据。与该数据同时推出的还包括规模庞大的用于网络信息检索评测...
[技术报告]基于泛型技术的工程优化方法 79 days ago Read More
基于泛型技术的工程优化方法
简介:本
文从对系统在工程层面上优化的角度出发,引入泛型程序设计技术,着重讲述了policy
classes和type_selector两种方法对于系统工程设计与性能上的优化。其中在对policy classes的介绍中,将其与C++
virtual
function做了详细分析与对比;在对type_selector技术的阐述中,介绍了如何实现源代码层面上的可配...
[技术报告]实现跨域访问的Ajaj 140 days ago Read More
实现跨域访问的Ajaj
简介:
Ajaj即Asynchronous Javascript And Javascript_Text。 它跟Ajax(具体的详细的介绍请参见Ajax: A New Approach to Web Applications。)类似,Ajaj也是在不刷新页面的情况下,和server进行交互,并且可以实现跨域交互。
点此下载 我要评论
[技术报告]XSS跨站脚本攻击及防范 148 days ago Read More
XSS跨站脚本攻击及防范
简介:
XSS(Cross Site script)跨站脚本攻击。它指的是恶意攻击者往Web页面里插入恶意html代码,当用户浏览该页之时,嵌入其中Web里面的html代码会被执行,从而达到恶意用户的特殊目的。本文介绍了该攻击方式,并给出了一些防范措施。
点此下载
我要评论
[技术报告]轻量级AJAX库 175 days ago Read More
简介:
Ajax作为一个非常常用的功能,在页面中的作用越来越举足轻重。而对于浏览器的支持,易用性,lib本身大小就成为了衡量一个lib的指标。作者重写了ajax library用来取代现有的prototype.js。
点此下载 下载附件Ajax.zip
乱序优化与GCC的Bug 182 days ago Read More
简介:
乱序优化是现代编译器非常重要的特性,本文介绍了什么是乱序优化,以及由此引发的一个gcc bug,希望引起各位开发者的注意。
全文链接:http://www.sogou.com/labs/report/1-2.pdf
[技术报告]C10K问题---epoll简介 188 days ago Read More
简介: 编写连接数巨大的高负载服务器程序时,经典的多线程模式和select模式都不再适用。应当抛弃它们,采用epoll/kqueue/dev_poll来捕获I/O事件。
全文链接:http://www.sogou.com/labs/report/1-1.pdf
搜狗实验室进一步数据需求征集 199 days ago Read More
搜狗实验室依托搜狗搜索技术研发能力和海量数据获取能力/搜狐矩阵的互联网资源/清华-搜狐搜索技术联合实验室面向产业界的研究方向/,自2006年11月成立以来一直致力于推动互联网相关技术的发展(包括中文处理技术、搜索引擎技术和多媒体处理技术等),目标是将实验室发展成为一个提供相关技术的资源和效果评测的平台。
搜狗实验室先后提供了互联网语料库、网页链接关系库、用户查询日志等数据资源,供研究机构免费...