Modulname:
---------------------------------------------------------------------------
Webgrab
Status:
---------------------------------------------------------------------------
beta
Bechreibung:
---------------------------------------------------------------------------
Ermöglicht das Abgreifen von Content von anderen Webseiten.
Links und Inhalte werden umgewandelt oder gefiltert bzw. ersetzt.
Features:
---------------------------------------------------------------------------
- Frontend editing
- Globale und spezifische Konfiguration
- Links und Inhalte werden umgewandelt oder gefiltert bzw. ersetzt.
Autor(en):
---------------------------------------------------------------------------
Michael Brauchl Version 1.0
Paul Eppner (paul@twomoons.de) Version 1.2
Karsten Pawlik Version 1.3
Karsten Pawlik Version 1.3.1 (bugfix release for 1.3)
Aki Version 2.0
bratzi Anleitung Version 2.0
Lizenz:
---------------------------------------------------------------------------
GPL
Benötigte Sefrengo Version:
---------------------------------------------------------------------------
>= 01.02.00 (Sefrengo 1.2)
Installation:
---------------------------------------------------------------------------
Wechseln Sie in Ihrer Sefrengo Version in den Bereich "Design->Module". Am
unteren Ende des Bereichs befindet sich ein Uploadfeld. Wählen Sie hier die
gewünschte "*.cmsmod"- Datei aus. Mit einem Klick auf das Diskettensymbol
wird das Modul in das CMS importiert. Das Modul ist nun innerhalb des CMS
nutzbar.
Update/ Migration:
---------------------------------------------------------------------------
Dokumentation:
---------------------------------------------------------------------------
Ausführliche Dokumentation in der Moduleinstellung.
Hallo Mistral
Ich habe heute versucht, das Modul zu benutzen.
Ich will eine Seite grabben, den unnötigen Code löschen, und nur den Text anzeigen.
Ich dachte ich fange mal einfach an. Aber das Modul löscht nichts, oder besser gesagt es ersetzt nicht die Blöcke mit einem Leerzeichen.
Die Seite die ich Grabben möchte ist: www.losungen.de/heute.php die generiert die Infos für den aktuellen Tag.
Die Konfiguration ist wie folgt:
Startseite:
Folgende Einschränkungen, ich betrachte das nicht als Bug, hat das Modul im Moment.
1.) Das Webgrabmodul kann nicht mehrmals auf einer Seite eingesetzt werden.
2.) Bestimmte URLs können nicht ausgelesen werden.
Der Typ URL muss immer mit einem Extender enden. Daraufgekommen bin ich, weil ich versucht habe eine Sefrengo-Seite mit deaktiviertem modrewrite zu grabben. (http://www.domain.de/index.php?idcat=6). Das geht nicht. Ausgelesen wird in diesem Fall nur die Indexseite. Anscheinend wird alles nach *.php abgeschnitten.
Nehme ich das gleiche Projekt, schalte modrewrite ein, verändert sich gleichzeitig die URL (http://www.domain.de/cat6.htm) und Webgrab funktioniert.
Servus. wird es eine Lösung geben, damit auch Seiten mit .php?blablabla gegrabbt werden können? Das wär für mich ne erleichterung, weil ich so eine seite einbinden muß. Leider funktioniert es ja so nicht.
Danke falls das problem gelöst wird. Ich brauch unbedingt ein Newsletter Modul, muß momentan aber auf einen opensource zurückgreifen.
Gruß toto
Also ich checke es überhaupt nicht wie es mit dem Webgrab funktionniert. Das mit den search/replace Parametern scheint überhaupt nicht zu gehen. Kein einziger meiner Versuche hat zu eine Code änderung geführt. Es wird wie in den vorherigen Beiträge erwähnt nichts geändert. Weiterhin schreibt das Modul immer okokokokokokokokokokokokok am Anfang des Webgrabbereiches.
Lt. Forum-Suche gibt es nicht viele Lösungen. Benutzt einer von Euch dieses Modul? Wenn ja, wie ist es konfiguriert? Vielleicht wäre eine detaillierte Beschreibung besser.
@Mike
Das okokokokokok habe ich Dir beseitigt , beim Rest hilft Dir vielleicht @gunwalt (da scheints ja zufunktionieren)
Ich habe mir jetzt die Zähne daran ausgebissen! Eigentlich klingt es idiotensicher, aber irgendwie klappt es nicht.
Egal welche Änderung ich durchführe, nichts ändert sich.
Nicht mal ein border der von 0 auf 2 geändert wird.
$location[0]['search'][0] = '<table cellspacing="0" cellpadding="0" border="0">';
$location[0]['replace'][0] = '<table cellspacing="0" cellpadding="0" border="2">';
Ein weitere Problem, das zwar warscheinlich nichts mit dem Modul zu tun hat ist, das eine Änderung des Seitentyp von utf-8 in iso-8859-1 im Head-Bereich keine Auswirkung auf den Webgrab hat.
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
gibt es vielleicht ein tool das ähnliches macht, aber speziell für interne seiten?
ich will gewisse bereiche der seite nur einmal eingeben und auf anderen seiten anzeigen lassen...
cheers! *s*
für den dirigenten gibte es zwei module, die genau das machen, was du möchtest:
http://www.der-dirigent.de/de/dedi/download/module/content_syndication/index.html#ia
http://www.der-dirigent.de/de/dedi/download/module/content_syndication/index.html#iac
ich glaube, die wurden noch nicht portiert.
sollte aber nicht allzu schwer sein. http://forum.sefrengo.org/index.php?showtopic=12 gibt es eine anleitung
EDIT:
hab mal schnell IncludeArticle portiert:
IncludeArticle.zip ( 2.12KB )
: 21
geht wirklich einfach. IncludeArticle importiert komplette seiten. wenn man bei start- und end-tag jeweils body eingibt, wir nur der seiteninhalt dargestellt, ohne head und so.
feniweb hat http://forum.sefrengo.org/index.php?showtopic=771&hl=include mal versucht, das modul «IncludeArticle Content» zu portieren. soviel ich weiss allerdings erfolglos.
gruss andi
Bei dem Modul includeArticel muss man nur aufpassen, dass allowurlfopen in der PHP-Konfiguration erlaubt ist wenn ich mich dunkel erinnere. Ist schon ewig her, als ich das zuletzt unter IDED benutzt habe.
wir wollen doch Google nicht mit unnützen Suchbegriffen füttern
Cool! Hier wird was geschrieben und keiner kann mir weiterhelfen!
Siehe http://forum.sefrengo.org/index.php?s=&showtopic=18&view=findpost&p=8272
Hm, das einzige was mir einfällt wäre zu prüfen ob es der Richtung Unstimmigkeiten gibt, beachte " und '
So, nach einiger Suche habe ich den Fehler gefunden. Beim Einfügen der Konfiguration in den Output war MOD_VALUE[1] mit Anführungszeichen umschlossen, so dass sie nur als String vorhanden war.
Zusammen mit dem "ok"-Bugfix und einigen Umformulierungen der etwas missverständlichen Anleitung (ich hoffe, ich hab's nicht noch schlimmer gemacht) habe ich eine neue Version veröffentlicht: Webgrab 2.1 - bitte testen!
Diese lokale/globale Konfiguration habe ich noch nicht richtig verstanden. Ist das lokale ein Spezialfall, für den man selbst die Datenbank mit der Konfig befüllen muss? Bei mir waren nie Werte dafür in der DB. Naja, sollte weiterhin funktionieren.
Gruß,
Nils
Unterstützt von Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)