天蠶在你身邊
不方便打電話?讓天蠶聯絡你
網頁表示模型包含這樣幾項信息元素:網頁標識、網頁類型、內容類別、標題、關鍵詞、摘要、正文、相關鏈接。
網頁類型是根據網頁內容的表現形式進行劃分的,網頁可分為三類:有主題網頁(topic)、圖片網頁(pic)、Hub網頁(hub)。
為什么將網頁分為上述三個類型呢?是因為三類網頁在用途和處理方法上存在較大的差別。
其中 Hub網頁與其它兩類網頁的區(qū)別在于網頁在Web上發(fā)揮的作用不同,Hub網頁通常不會具體的講述一件事物,而是提供關于相關信息的鏈接集。而圖片網頁與 其它兩類網頁的區(qū)別在于處理的方法不同,由于圖片網頁的內容是通過圖片表達的而不是通過文字,因而,傳統(tǒng)信息處理領域的方法對圖片網頁是不夠有效的。三類 網頁間的區(qū)別導致很多應用領域都會對它們作適當的區(qū)別。
內容類別是從語義上對網頁的內容進行分類,它是搜索引擎獲取網頁語義信息的一個直接手段,在Web上的研究領域中有著廣泛的使用。它是通過特定的分類器對網頁內容分類得到的,依賴于一定的分類體系
重慶網絡公司
地址:重慶市渝中區(qū)上清寺鑫隆達B座28-8
郵編:400015
電話:023-63612462
EMAIL:cnjl_net@163.com