《电子技术应用》
您所在的位置:首页 > 嵌入式技术 > 业界动态 > 新型搜索引擎可搜索网站源代码

新型搜索引擎可搜索网站源代码

2014-10-15

从今天开始,设立在纽约的NerdyData服务器已经颠覆了类似于谷歌这样的传统搜索引擎行业。NerdyData 使得企业家能够搜索他们竞争对手的源代码而不只是搜索网站的内容。


 

23岁的联合创始人Steve Sonnes在今天下午的采访中提到,“当你从一个不同的角度去思考,你将发现我们可以用许多不同的方法去重构搜索方式,NerdyData 就是专为搜索源代码而推出的搜索引擎。”

Sonnes 认为高效的搜索引擎专业人士可以使用 NerdyData 来检查他们自己和竞争对手的链接,从而创造正如他所称的打造品牌权威的机会;搜索 HTML 素材中的关键字,并且分析 CSS、Javascript 和 DOM 等一切可用来建立一个网站的资源。

企业家也能够看到他们的竞争对手使用的是哪一种部件,看到同一个谷歌分析账户名下的网站,哪些网站被某一团队贴上他们标题标签,最终还能知道哪些网站使用某一特定颜色。

公司的网络爬虫已经浏览过超过一亿四千万的主页并且收集了6.2万亿字节的关于 HTML,Javascript和 CSS 的代码。他们也设计了几个网站接口允许使用者查询网页的源代码或者在企业内部下载包含具体条目的网站清单。


 

Sonnes 写到,“我们甚至为引擎优化和市场者提供专门的搜索接口,这些接口能够为你搜索具体的HTML 标签,类似于元数据描述和元关键字。”

虽然这个网站目前只完成了不到百分之一的工程量,但是他们并不想在发展的早期阶段就揭示网站未来的特性。

Sonnes 和他的追随者,23岁的共同创始人 David Bielik,他们也是刚从纽约的 Stony Brook 大学毕业,在那里他们一见如故。在建立域名搜索引擎的同时他们创造了网络爬虫,如今网络爬虫被用于检索和搜寻源代码。

Sonnes 说:“没有其他人在做这个,所以我们要成为最好的,我们花了三个月的时间来构造完整的 NerdyData 架构,今后我们会仍然努力工作尽我们最大的能力让它逐渐走上正轨。”


 

没有 NerdyData,对于在那些每天在网上点击页面详情的浏览者而言,仍然要面对依旧存在的大量的旧信息,而 NerdyData 只是同时横跨在数以百万计的网站上做这件事情而已。

一个基础账户每个月可以搜索200次,并且每次查询有10个结果是免费的;一个专业账户每个月花费99美元,并且可以进行1200次搜索,每次搜索获得高达5000个以上的结果,对于企业账户而言,每个月消费149美元,每个月获得超过3000次搜索,并且每次查询可获得1万个搜索结果。

Sonnes 和 Bielik 已经带领他们的公司走过了困难期,他们现在有五台服务器,每台服务器每月花费是400美元。他们有600个使用者使用基本包,但只有不超过10个付费使用者。

“这就是我们每个月的收入。”Sonnes自豪地说。

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。