***** To join INSNA, visit http://www.insna.org *****
Hi list,
We propose a Post Doc Position at the Laboratory for Enriching Services to Facilitate Access to Information (EASY) at France Telecom R&D, Brittany, France.
1 year post doc position is available at EASY for individuals with a Ph.D. interested in graph theory, complex social networks, multi-facet profiling and propagation problematics. The work is applicative and aims to facilitate recommendation of content. The job consists in conceiving algorithms optimized to (big) social networks and taking into account the multi-identity of individuals into the propagation process. Based on real data (networks, metadata and textual content, logs) we offer opportunities of concrete SNA-based techniques. Opportunities for publications and patents will exist.
Start date: sping or summer 2006
Requirements:
Must have good development skills (Java). Must have good skills in algorithms dedicated to graph theory and especially to social network analysis. Abilities in clustering and communities discoring very welcome. Would be easier if able to write/speak French, but not essential.
Interested individuals should send their vita and a short 2 page sample of writing (partly in French) to Cécile Bothorel: [log in to unmask]
French description :
==============
Analyse locale des réseaux (ego-nets) : détection, analyse et utilisation de facettes.
Utilisation des facettes à un niveau global du réseau pour la propagation ciblée (recommandation contextuelle)
Mots-clés : social media, flux contextuels, graph et text-mining, facettes, personnalisation, recommandation
Contexte :
------------
Dans le cadre des réseaux sociaux, comme par exemple un ensemble de personnes communiquant par email, on s'intéresse au réseau tel que perçu par un individu (l'ego-net). Un individu échange des emails avec plusieurs groupes de personnes : amis, collègues, famille etc... Cet individu ne se présente pas de la même façon dans toutes ses interactions. La question de l'identité sociale est loin d'être triviale. Les travaux de Danah Boyd [danah] ont introduit la notion de "facette" dans les réseaux sociaux. La modélisation des individus par un profil unique et immuable pose depuis longtemps problème dans les systèmes de recommandation et débouche sur la problématique de la gestion d'identité contextuelle. L'analyse des usages et en particulier de traces ouvrent des perspectives quant à la découverte de contexte d'activités . En particulier, l'analyse de traces d'interactions tels que les emails nous paraît intéressante car les facettes, souvent implicites, se matérialisent à la fois dans le contenu des échanges mais également dans le choix des interlocuteurs.
L'ensemble des facettes peut être fixé à l'avance (taxonomie type carnet d'adresse, ou encore des tags types del.ic.ious), chaque utilisateur typant alors ses liens (ou contacts) en choisissant parmi les étiquettes possibles (famille, boulot, connaissance, ou toute autre thématique, etc.).
L'autre possibilité consiste à détecter de façon automatique les facettes, en fonction par exemple du langage, des thèmes utilisés dans les échanges, ou bien encore les interlocuteurs. C'est cette deuxième approche que nous retenons ici.
A l'échelle du réseau (global), sans facettes, nous pouvons opérer des calculs de communautés (clustering), qui peuvent s'avérer suffisants pour la description ou la visualisation d'écosystèmes. Dans une perspective d'utilisation pour la recommandation par exemple, ou plus généralement le propagation sélective de flux, on s'attachera à qualifier les liens de manière plus fine, ce qui revient potentiellement définir des communautés contextuelles, et plus proches de la réalité, en se basant sur les facettes de chacun des individus. Dans ce cas, une communauté regroupe des individus liés par des relations impliquant des facettes compatibles. Ainsi, en plus de la découverte de facettes, il s'agira de déterminer des outils de mesure d'adéquation entre facettes et des méthodes de propogation de flux ciblés exploitant ces facettes.
Travail à réaliser :
-----------------------
Le post-doc devra tout d'abord mettre en oeuvre des techniques permettant d'extraire les facettes à partir d'exemples d'ego-net (clustering de graphe, graphmining + text-mining). Il faudra ensuite analyser ces facettes, par exemple pour déterminer les facettes proches ou compatibles, pour un même individu. Il s'agira ensuite de passer à l'échelle du réseau et de concevoir des outils d'utilisation de facettes. Il pourra être utile de mettre en place de nouvelles mesures (type centralité [brandes], coefficient de clustering), adaptées à la manipulation de réseaux sociaux avec facettes.
Les facettes pourront ensuite être utilisées par exemple pour déterminer des communautés, ou afin de réaliser des recherches ciblées dans un réseau social ou propager de manière sélective des contenus, les facettes servant alors à élaguer les recherches ou mieux répoartir les flux (le contraire du broadcast). Il s'agira ici d'un travail algorithmique visant à enrichir les outils d'analyse de réseaux sociaux, en accentuant la recherche sur la performance et le passage à l'échelle pour des réseaux de grande taille.
Ces différentes tâches impliquent une recherche bibliographique dans le domaine des mesures de type réseau social et du clustering de graphe, l'invention de méthodes adaptées aux problèmes à traiter, ainsi qu'une validation pratique et théorique (implementation, mise en oeuvre et comparaison à l'existant) des méthodes développées.
Cadre de travail :
---------------------
Le travail sera réalisé en se basant sur la bibliothèque JAVA de l'équipe (JAIL), qui propose un certain nombre d'outils de gestion et de manipulation de graphes, en particulier dans le cas des réseaux sociaux. Les méthodes développées devront s'intégrer dans cette bibliothèque. Nous disposons de données réelles.
Durée : 1 an, reconductible éventuellement 6 mois.
Situation : France Telecom R&D, Av. Pierre Marzin, 22300 Lannion, Bretagne.
Compétences requises/souhaitées :
------------------------------------------------
* Théoriques :
- Méthodes de clustering (en général), clustering de graphe en particulier.
- Théorie des graphes, Réseau sociaux
- Text-mining
* Pratique :
- Programmation JAVA
- XML, GML
- BDD (MySQL par exemple)
Bibliographie :
-------------------
[danah] <http://www.danah.org/> http://www.danah.org/
[brandes] A Faster Algorithm for Betweenness Centrality. Journal of Mathematical Sociology, 25(2):163-177, 2001
_____________________________________________________________________
SOCNET is a service of INSNA, the professional association for social
network researchers (http://www.insna.org). To unsubscribe, send
an email message to [log in to unmask] containing the line
UNSUBSCRIBE SOCNET in the body of the message.
|