Enunt:
Se cere sa se realizeze o aplicatie care sa extraga cunostinte referitoare
la relatiile sociale in cadrul unei comunitati. Aplicatia va pleca de
la url-ul unui utilizator si va extrage informatiile despre relatiile
acestuia in interiorul comunitatii prin analiza paginilor HTML de pe
site-ul/site-urile comunitatii respective.
Exemple:
pentru bloguri: se extrag linkurile din blogroll si tipul relatiei se poate
stabili ca fiind "blogroll" sau cea descrisa de atributul rel din
cadrul elementului <a>. Se extrag linkurile din numele celor ce
comenteaza si relatia dintre cel ce comenteaza si proprietarul
blogului o botezam "fan".
Pentru comunitati de tipul youtube avem urmatoarele relatii: friends, fans, persoane care comenteaza
videoclipurile.
Observatie:
exista
comunitati care ofera API-uri pentru obtinerea datelor din
comunitate. Se fac cereri catre url-uri de pe site-ul respectiv si se
returneaza un XML la fel ca in exemplul de la laborator.
Aplicatia va citi din directorul curent un director config.xml care va avea urmatoarea structura:
<config>
<url>url-ul aplicatiei din care extrageti
date</url>
<username>username-ul/id-ul utilizatorului de unde incepeti extragerea</username>
<depth value="valoare numerica - adancimea pana la care se face parcurgerea in retea">
</config>
Relatiile extrase se vor exporta intr-un fisier XML ce va avea urmatoarea structura:
<socialnetwork>
<user url="url-ul la care se afla profilul
utilizatorului">
<relation type="" url="url-ul la care se afla profilul utilizatorului cu
care se afla in relatie" degree="distanta fata de user" ref="url-ul
utilizatorului de la care s-a descoperit"/>
</user>
</socialnetwork>
Download: