Willkommen, Gast ( Anmelden | Registrierung )     [ Hilfe | Mitglieder | Suche ]

 
Reply to this topicStart new topic
> Bug im Pfadesystem??
Skylab
Beitrag Sat. 13. March 2010, 14:09
Beitrag #1


Advanced Member
*****

Gruppe: Neustart-Moderator
Beiträge: 176
Mitglied seit: 03.02.2007
Mitglieds-Nr.: 625



Hallo Leute,

ich habe jetzt schon einige Nächte damit verbracht, einem Fehler auf meiner Seite auf die Spur zu kommen. Irgendwas scheint bei den Pfaden von Ordner und Seiten nicht ganz koscher zu sein.
Ich dachte erst ich habe mir selbst einen Bock geschossen, habe dann aber mal 2-3 Seiten von Euch welche im Schaufenster gelistet sind durch ein Tool gejagt. Dort ist ist das gleiche Problem!

Also zum Fehler, der NUR unter aktiviertem Mod Rewrite auftritt:

Ich habe z.B. eine Ordnerstruktur die wie folgt aussieht:

Host: www.Meineseite.de

------------------------------
Startordner
>> Startseite

___Unterordner-blau
>> Unterseite-blau-1
>> Unterseite-blau-2

___Unterordner-gruen
>> Unterseite-gruen-1
>> Unterseite-gruen-2
>> Sitemap

___Unterordner-rot
>> Unterseite-rot-1
>> Unterseite-rot-2

Hauptordner-2
>> Unterseite-Hauptordner-2

-------------------------------

Wenn ich nun die Unterseite-1 aus dem Unterordner-rot aufrufe, müßte in der URL erscheinen:

www.Meineseite.de/Startordner/Unterordner-rot/Unterseite-rot-1.html

Wenn ich die Seite über das Frontend aufrufe stimmt diese Struktur und wird über jede verlinkte Seite korrekt angezeigt.
ABER ...

Ich hatte mich neulich gewundert warum das google Webmastertool für viele meiner Seiten eine 404 bzw. 302 ausgibt die doch eigentlich OK sind.

Nach Prüfung mit Database Search habe ich es herausgefunden:

Beim Crawlen von Seiten entsteht für eben genannte Seite die folgende Struktur:

www.Meineseite.de/Startordner/Unterordner-rot/Startordner/Unterordner-rot/Unterseite-rot-1.html

D.h. im Root werden Pfade dubliziert die ein Crawler so liest und als 404 deklariert.


Da im Frontend alles ok ist, wäre das eigentlich völlig egal, wenn jedoch google 30 meiner Seiten eine 404 gibt ist das äußerst schlecht.

Hat hierzu irgend jemand eine Idee?

Bin gespannt auf Feedback,

Grüße

Go to the top of the page
 
+Quote Post
Guest_bkm_*
Beitrag Sat. 13. March 2010, 14:51
Beitrag #2





Guests






ZITAT(Skylab @ Sat. 13. March 2010, 14:09) *
..... Schaufenster gelistet sind durch ein Tool gejagt. Dort ist ist das gleiche Problem!

Was für ein Tool ist das ??

Hat nicht Google Webmaster-Tool eine Rubrik ( Abruf wie durch Googlebot ), da müsstest Du ja auch einen 404 bekommen.
Go to the top of the page
 
+Quote Post
Skylab
Beitrag Sat. 13. March 2010, 15:24
Beitrag #3


Advanced Member
*****

Gruppe: Neustart-Moderator
Beiträge: 176
Mitglied seit: 03.02.2007
Mitglieds-Nr.: 625



ZITAT(bkm @ Sat. 13. March 2010, 14:51) *
Was für ein Tool ist das ??

Hat nicht Google Webmaster-Tool eine Rubrik ( Abruf wie durch Googlebot ), da müsstest Du ja auch einen 404 bekommen.


Hi,

Webmaster-Tools liest die Seite unter "Abruf wie google Bot" ein, dennoch kennzeichnet google die Seite gleichzeitig als 404.

Von der Startseite aus ist alles in Ordnung und ensteht nur von Unterverzeichnissen. Scheint als ob das an der Verlinkung von unten nach oben liegt. Aber sieh` selbst:

Nimm mal diese Seite z.B.

"http://www.zahnarzt-dr-moser.de/praxis/service/unser-service-fuer-sie.html"

und teste bei: http://www.database-search.com/sys/link-check.php

unter aktivierten Check "broken links"

Ergebnis: der Ordner "Service" wird zweimal abgebildet.

.......???? blink.gif
Go to the top of the page
 
+Quote Post
Taturo
Beitrag Sat. 13. March 2010, 17:45
Beitrag #4


Advanced Member
*******

Gruppe: AdvancedMembers
Beiträge: 328
Mitglied seit: 29.08.2006
Wohnort: Konstanz / Bodensee
Mitglieds-Nr.: 216



Hallo Skylab,

das Tool wirft die 404 nicht nur bei internen Seitenverlinkungen, sondern auch bei Dateilinks aus. Ausserdem nicht nur bei Sefrengo, sondern auch bei anderen CMS, getestet habe ich z.B. Typo3 Seiten. Gleiches Ergebnis, alles 404.

Ich denke es liegt am basepath, der vom Tool nicht richtig verarbeitet wird. Andere Linkchecker werfen für die gleiche Seite keine 404 aus.

Gruss,
Andreas
Go to the top of the page
 
+Quote Post
Skylab
Beitrag Sun. 14. March 2010, 00:08
Beitrag #5


Advanced Member
*****

Gruppe: Neustart-Moderator
Beiträge: 176
Mitglied seit: 03.02.2007
Mitglieds-Nr.: 625



ZITAT(Taturo @ Sat. 13. March 2010, 17:45) *
Hallo Skylab,

das Tool wirft die 404 nicht nur bei internen Seitenverlinkungen, sondern auch bei Dateilinks aus. Ausserdem nicht nur bei Sefrengo, sondern auch bei anderen CMS, getestet habe ich z.B. Typo3 Seiten. Gleiches Ergebnis, alles 404.

Ich denke es liegt am basepath, der vom Tool nicht richtig verarbeitet wird. Andere Linkchecker werfen für die gleiche Seite keine 404 aus.

Gruss,
Andreas



Hallo Andreas,

da bin ich mir nicht so sicher ob das Tool falsch arbeitet, denn google wirft unter den Webmastertool bei Diagnose/Crawling-Fehler die selben Werte aus. Dann müßte google ja auch die Seiten falsch verarbeiten?!

Du schreibst andere CMS bringen die selben Ergebnisse, stimmt so nicht ganz (aber Typo3 bringt tatsächlich auch den Fehler).
. Z.B. Das CMS Papoo wirft die Links richtig aus wie z.B. bei:

"http://www.werbetexterin.de/texter-webseiten/homepage-internetauftritt.html"

oder (ich glaube mit Wordpress)

"http://www.pamueller.de/neue-zahnaerzte-gewinnen-mehr-zahnersatz/neue-zahnaerzte-gewinnen-erfolgskurs.php"

Was aber ganz interessant ist, ich habe eine Sefrengo Seite gefunden, die sowohl mit falscher als auch mit richtiger Adresse auf die richtige Seite linkt (und dies nicht mit ner 302/301), weißt Du wie das gemacht wurde???

Frontendadresse=
"http://www.seminarren.eu/irre-beispiele/praxisbeispiele/soka-bau-mission-to-ksc.html"

Diese Seite ist aber auch unter dem (eigentlich) falschen Pfad erreichbar
"http://www.seminarren.eu/irre-beispiele/praxisbeispiele/irre-beispiele/praxisbeispiele/soka-bau-mission-to-ksc.html"

++Nachtrag++

Ich habe mir mal die Mühe gemacht und habe meine Logfiles vom Server angesehen. Die URL´s wurden immer korrekt von google eingelsen bis zum 27.02. ab diesem Datum wurde bei den Pfaden ein oder 2 Ordner im Root dazugemogelt, ein paar Tage später wurde wieder richtig eingelesen. Dieser Fehler häufte sich und endete damit, dass seit ein paar Tagen der Fehler permanent im Root des Logfiles unter google-bot steht. Das deckt sich auch damit, dass seit ein paar Tagen meine URL aus dem google index verschwunden ist (klar, wenn´s nix zu lesen gibt).
Der Fehler trat auf, nachdem ich versehentlich mal für 1 Tag in den Projekteinstellungen die 404 von 0 auf 1 gesetzt hatte. Seit dem werden die Pfade vertauscht.
Ich werde wohl oder übel ein update machen oder das Projekt ganz neu aufsetzen müssen.

Gruß, Oli

Der Beitrag wurde von Skylab bearbeitet: Sun. 14. March 2010, 14:19
Go to the top of the page
 
+Quote Post
Taturo
Beitrag Sun. 14. March 2010, 17:55
Beitrag #6


Advanced Member
*******

Gruppe: AdvancedMembers
Beiträge: 328
Mitglied seit: 29.08.2006
Wohnort: Konstanz / Bodensee
Mitglieds-Nr.: 216



Hallo Skylab,

ich meinte nicht alle CMS die es gibt.
Wie gesagt, meiner Meinung nach hat das Tool Probleme mit dem basepath. Die beiden von dir angegebenen Seiten arbeiten ohne basepath.

Ich habe nochmal ein paar Seiten von mir durchgetestet. Jede Menge 404 im DatabaseSearch Tool, keine Fehler bei anderen Linkcheckern.
Auch keine Crawlingfehler in den Google Webmastertools für die gleiche Homepage (Wobei dort wohl immer von der Hauptdomain ausgegangen wird, oder gibt es eine Möglichkeit auch Unterseiten zu testen?).

Gruss,
Andreas
Go to the top of the page
 
+Quote Post
Skylab
Beitrag Sun. 14. March 2010, 18:13
Beitrag #7


Advanced Member
*****

Gruppe: Neustart-Moderator
Beiträge: 176
Mitglied seit: 03.02.2007
Mitglieds-Nr.: 625



ZITAT(Taturo @ Sun. 14. March 2010, 17:55) *
Hallo Skylab,

ich meinte nicht alle CMS die es gibt.
Wie gesagt, meiner Meinung nach hat das Tool Probleme mit dem basepath. Die beiden von dir angegebenen Seiten arbeiten ohne basepath.

Ich habe nochmal ein paar Seiten von mir durchgetestet. Jede Menge 404 im DatabaseSearch Tool, keine Fehler bei anderen Linkcheckern.
Auch keine Crawlingfehler in den Google Webmastertools für die gleiche Homepage (Wobei dort wohl immer von der Hauptdomain ausgegangen wird, oder gibt es eine Möglichkeit auch Unterseiten zu testen?).

Gruss,
Andreas


Hi Andreas,

bei meiner Seite gibt das webmaster-tool auch die Unterseiten aus, d.h. derzeit sind es an der Zahl ca. 34 und es werden jeden Tag mehr obwohl keine Änderungen vorgenommen wurden. Wie ich schon schrieb, ich denke mein System hat einen Knax, denn google crawlte die ganze Zeit Seiten die alle "bene" waren (nach Logfile) und auf einmal stehen die selben Seiten im Logfile mit falschem Pfad (durch doppelte Verzeichnisse). Na ja, wie auch immer Database zu werten ist, google findet mein Zeug nicht mehr.
Der einzige Grund warum meine Unterseiten überhaupt noch gefunden werden ist, weil Sie richtig in der xml sitemap stehen.

...Relaunch!
Go to the top of the page
 
+Quote Post
Guest_bkm_*
Beitrag Sun. 14. March 2010, 22:02
Beitrag #8





Guests






Soll ich mal schauen ob ich einen Fehler finde ? Dann schreib mal Deine Zugangs-Daten per PN.
Go to the top of the page
 
+Quote Post
mvsxyz
Beitrag Mon. 15. March 2010, 10:20
Beitrag #9


Advanced Member
********

Gruppe: Admins
Beiträge: 507
Mitglied seit: 27.06.2006
Mitglieds-Nr.: 11



Ich habe auf einem Projekt auch mod_rewrite=2 aktiviert und ein ähnliches Verhalten beobachtet. Im Statistik-Plugin (Slimstat) werden von manchen Crawlern merkwürdige URLs aufgerufen. Sie sehen wie die von Skylab beschriebenen.

Nun kann es wirklich sein, dass diese Seiten den Basepath nicht korrekt interpretieren, oder noch ein Fehler im mod_rewrite von Sefrengo liegt. Eine Lösung habe ich auch gerade nicht parat.
Go to the top of the page
 
+Quote Post
Skylab
Beitrag Mon. 22. March 2010, 10:06
Beitrag #10


Advanced Member
*****

Gruppe: Neustart-Moderator
Beiträge: 176
Mitglied seit: 03.02.2007
Mitglieds-Nr.: 625



So, System läuft wieder!

Ich habe das komplette Backend und die Datenbank vom Backup neu einspielen müssen. Jetzt interpretiert google die Pfade wieder richtig, also alle 404 sind weg.

Nochmals zur Ursache:
nachdem ich bei den Projekteinstellungen unter dem Punkt:
Basepath bei UrlRewrite=2. Variablen: {%http_host} / statt 0 eine 1 eingegeben hatte

und bei

404 Fehlerseite bei nicht existierender idcatside/ idcat als idcatside / eine 1 eingegeben hatte

(... und beide gleich wieder zurückgestellt auf 0, nachdem ich gemerkt hatte, dass da was nicht funktioniert )

wurden von URL-Rewrite dauerhaft die Pfade durcheinandergewürfelt.

Fazit:
nicht rumspielen mit den Projekteinstellungen wenn man nicht weiß was passiert und immer ein aktuelles Backup parat haben!

Gruß, Oli
Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 Besucher lesen dieses Thema (Gäste: 1 | Anonyme Besucher: 0)
0 Mitglieder:

 



RSS Vereinfachte Darstellung Aktuelles Datum: 19.4.24 - 10:41

Sefrengo ist ein eingetragenes Markenzeichen und urheberrechtlich geschützt.
Copyright 2009 Design & Daten, Alle Rechte vorbehalten.