Installer Adobe PDF IFilter 9 pour SharePoint 2010

L’indexation consiste à extraire les mots contenus dans un document. Une fois que l’index est créé, les utilisateurs peuvent faire des requêtes sur l’index. Si la requête correspond à un contenu (par exemple, un document), un lien est fait vers le document.

L’indexation du contenu des fichiers au format PDF nécessite d’installer un IFILTER gratuit. L’indexation de fichiers PDF doit ensuite être activée (Adding Searchable File Types to SharePoint Foundation 2010).

Par ailleurs, l’indexation des fichiers au format PDF n’est possible que pour ceux qui ont été créé avec leurs glyphes. Un glyphe d’un caractère est sa représentation. Par exemple « A » est le glyphe de la lettre « a » ou « A ».

Cela signifie que si le fichier PDF a été créé sous forme d’image bitmap, SharePoint n’est pas en mesure de l’indexer nativement. Pour cela, il est nécessaire d’utiliser des add-ons qui procèdent à une reconnaissance de caractères (OCR).

Liste non exhaustive d’éditeurs qui proposent ces solutions :

Procédure d’installation de Adobe PDF IFilter

La procédure d’indexation suivante vous explique comment installer Adobe PDF IFilter 9 pour SharePoint 2010 et le faire fonctionner. Toutes ces opérations doivent être faites sur les serveurs SharePoint frontaux.

Téléchargez Adobe PDF IFilter 9 à l’adresse Adobe – Acrobat For Windows Adobe PDF iFilter 9 for 64-bit platforms.

Ensuite, dézippez et installez PDFFilter64installer.msi en double-cliquant dessus. L’installation n’appelle pas de commentaires particuliers: validez tous les écrans jusqu’à la fermeture de l’installeur.

L’étape suivante explique comment avoir l’icône PDF associés aux fichiers PDF de SharePoint.

Téléchargez l’icône pdficon_small.png en 16 x16 des fichiers Adobe PDF à l’adresse Use of Adobe icons and web logos.

Enregistrez l’icône à l’emplacement des images. Par défaut, il s’agit de l’emplacement  C:Program FilesCommon FilesMicrosoft SharedWeb Server Extensions14TEMPLATEIMAGES.

Par précaution, faites une copie de sauvegarde du fichier DOCICON.XML. L’emplacement par défaut est C:Program FilesCommon FilesMicrosoft SharedWeb Server Extensions14TEMPLATEXML.

Avec le bloc-notes Notepad, ouvrez le fichier DOCICON.XML puis ajoutez l’entrée suivante sous la balise <ByExtension>:
<Mapping Key= »pdf » Value= »pdficon_small.png »
OpenControl= »PdfFile.OpenDocuments »/>

Une fois modifié, le fichier ressemble à
<?xml version= »1.0″ encoding= »utf-8″?>
<DocIcons>
<ByProgID>
….
</ByProgID>
<ByExtension>
….
<Mapping Key= »pdf » Value= »pdficon_small.png »
OpenControl= »PdfFile.OpenDocuments »/>
….
</ByExtension>
<Default>
<Mapping Value= »icgen.gif »/>
</Default>
</DocIcons>

Une fois les modifications terminées, enregistrez et fermez le bloc-notes.

Pour que SharePoint sache qu’il doit indexer les fichiers avec une extension PDF, il faut le lui indiquer en ajoutant le type de fichiers PDF à l’index de contenu.

Pour ajouter le type de fichiers PDF à l’index de contenu, allez sur la page d’accueil de l’Administration centrale SharePoint, dans la section Gestion des applications, puis cliquez sur Gérer les applications de service.

Dans la page Gérer les applications de recherche, cliquez sur l’application de service de recherche. Le nom de l’application de service de recherche est libre. Si vous ne connaissez pas son nom, cherchez le type Application de service de recherche.

Si aucun type Application de service de recherche n’apparaît vous devez créer une nouvelle application de service de recherche avec le bouton Nouveau.

Dans la page Administration de la recherche, dans la barre de lancement rapide de la section Analyse, cliquez sur Types de fichiers.

Dans la page Gérer les types de fichiers, cliquez sur Nouveau type de fichier.

Dans la page Ajouter un type de fichier, dans la zone Extension de fichier, tapez l’extension: pdf puis cliquez sur OK.

Fermez l’Administration centrale.

Pour finaliser l’installation, la base de registre doit aussi être modifiée.

Dans la base de register allez jusqu’à HKEY_LOCAL_MACHINESOFTWAREMicrosoftOffice Server14.0SearchSetupContentIndexCommonFiltersExtension.

Faites un clic droit sur Extension, puis cliquez sur Nouveau, et cliquez sur Clé.

Saisissez .Pdf, puis appuyez sur Entrée.

Cliquez sur .Pdf, puis faites un clic droit sur (par défaut), et  cliquez sur Modifier.

Saisissez le GUID suivant dans la zone Valeur {E8978DA6-047F-9C78-4E3D-CDBE46041603}

Base de registre modifiée

La prise en compte de ces modifications nécessité de redémarrer les services associés.

Pour cela, redémarrez le service de recherche de SharePoint puis redémarrer tous les serveurs SharePoint de la batterie de serveurs.

Liste des fichiers PDF issus de la recherche SharePoint 2010

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *