Čištění HTML značek z popisů zboží a chytrý výběr více kategorií, dvě další Mergadovy opravy dat pro vyhledávače zboží

Odstranit HTML značky

Nešvar některých e-shopů je, že do XML pro Heureku, Zboží.cz či jiné vyhledávače zboží vkládají HTML značky. Poznáte je podle toho, že jsou uzavřeny do špičatých závorek, například <p>, </span> atp. Tyto značky některé vyhledávače zboží zlobí, a tak jsem připravil pravidlo, které je automaticky odstraní.

Odstranění HTML tagů z popisu zboží DESCRIPTION

Ilustrace fungování Mergadova pravidla Odstranit HTML značky.

Vybrat kategorii

Některé e-shopy umožní zařadit jednu položku zboží do více kategorií. A následně generují do XML pro Heureku vícekrát značku CATEGORYTEXT. Tento element je pro Heureku velice důležitý. Heureka ovšem umí zpracovat pouze první výskyt elementu CATEGORYTEXT a ostatní ignoruje. Pokud má e-shop v XML nejprve CATEGORYTEXT „Výprodej“ a až následně „Rybářské potřeby | Stany a přístřešky | Rybářské přístřešky“, zpracuje Heureka pouze „Výprodej“. Tato kategorie není kvalitní a zboží nebude spárováné. Mergadovo nové pravidlo toto řeší tak, že vyskytne-li se element CATEGORYTEXT vícekrát, ponechá pouze ten nejlepší a ostatní skryje.

Výběr z více výskytů elementu CATEGORYTEXT pomocí Mergada

Ilustrace fungování Mergadova pravidla Vyber kategorii.

Jak zapnout tato nová pravidla

Jednoduše v exportu na stránce Pravidla klikněte na odkaz Vytvořit pravidlo a jako Typ pravidla vyberte Odstranit HTML značky nebo Vybrat kategorii. Uložte stiskem tlačítka vespod stránky. Změna se projeví po pravidelném přegenerování dat Mergadem.

Vyzkoušejte si nová pravidla přímo v Mergadu!

 

Přidat komentář