
国家知识产权局信息显示,阿里巴巴(中国)有限公司申请一项名为“一种获取网页内容的方法、装置和设备”的专利,公开号CN121071252A,申请日期为2025年7月。
专利摘要显示,本发明实施例公开了一种获取网页内容的方法、装置和设备。本发明实施例中,通过获取超文本标记语言HTML格式的网页文本;将所述网页文本转换为特定格式的格式化文本;将所述格式化文本输入到预先训练的大模型中,输出标注文本,其中,所述大模型为融合了条件随机场的大语言模型,用于对所述格式化文本生成的多个令牌进行标注;根据所述标注文本确定网页内容。通过上述方法,可以快速准确的在各种网页结构的互联网页面中获取网页内容,并且减少人工维护成本。
天眼查资料显示,阿里巴巴(中国)有限公司,成立于2007年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本15460.55039万美元。通过天眼查大数据分析,阿里巴巴(中国)有限公司共对外投资了60家企业,参与招投标项目91次,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可19个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
券商配资开户提示:文章来自网络,不代表本站观点。