Odstranit HTML značky
Nešvar některých e-shopů je, že do XML pro Heureku, Zboží.cz či jiné vyhledávače zboží vkládají HTML značky. Poznáte je podle toho, že jsou uzavřeny do špičatých závorek, například <p>, </span> atp. Tyto značky některé vyhledávače zboží zlobí, a tak jsem připravil pravidlo, které je automaticky odstraní.
Ilustrace fungování Mergadova pravidla Odstranit HTML značky.
Vybrat kategorii
Některé e-shopy umožní zařadit jednu položku zboží do více kategorií. A následně generují do XML pro Heureku vícekrát značku CATEGORYTEXT. Tento element je pro Heureku velice důležitý. Heureka ovšem umí zpracovat pouze první výskyt elementu CATEGORYTEXT a ostatní ignoruje. Pokud má e-shop v XML nejprve CATEGORYTEXT „Výprodej“ a až následně „Rybářské potřeby | Stany a přístřešky | Rybářské přístřešky“, zpracuje Heureka pouze „Výprodej“. Tato kategorie není kvalitní a zboží nebude spárováné. Mergadovo nové pravidlo toto řeší tak, že vyskytne-li se element CATEGORYTEXT vícekrát, ponechá pouze ten nejlepší a ostatní skryje.
Ilustrace fungování Mergadova pravidla Vyber kategorii.
Jak zapnout tato nová pravidla
Jednoduše v exportu na stránce Pravidla klikněte na odkaz Vytvořit pravidlo a jako Typ pravidla vyberte Odstranit HTML značky nebo Vybrat kategorii. Uložte stiskem tlačítka vespod stránky. Změna se projeví po pravidelném přegenerování dat Mergadem.
Vyzkoušejte si nová pravidla přímo v Mergadu!
Přidat komentář