Auteur Topic: Bestanden met vreemde leestekens niet uit te pakken  (gelezen 9983 keer)

Dit onderwerp bevat een als beste antwoord gemarkeerd bericht. Klik hier om er direct naartoe te gaan.

Stephan296

  • Gast
Bestanden met vreemde leestekens niet uit te pakken
« Gepost op: 29 december 2015, 15:05:25 »
Ik krijg de laatste tijd regelmatig bestanden van een bepaalde release groep.
hier staat het copyright teken in, hier kan linux/nzbget schijnbaar niet niet mee omgaan.
Downloaden is geen probleem, echter het uitpakken werkt niet.
Hij geeft dan een error op het uitpakken.
Na het downloaden de bestanden hernoemen werkt ook niet omdat de bestanden volgens dsm niet te benaderen zijn.
Is hier wat aan te doen, zodat nzbget de leestekens wel pakt?

Offline Birdy

  • Global Moderator
  • MVP
  • *
  • Bedankjes
  • -Gegeven: 1399
  • -Ontvangen: 8046
  • Berichten: 44.169
  • Fijne feestdagen.......
    • Truebase
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #1 Gepost op: 29 december 2015, 15:42:53 »
Voor postprocessing is wel een script, lees deze eens door.
Echter, jij hebt kennelijk OOK problemen met uitpakken maar, dat script kan je ook wel voor het uitpakken draaien. ;)
Je kunt natuurlijk ook via PuTTY, als het uitpakken is mislukt van wegen dat soort tekens, ook handmatig wijzigen.


CS406      DSM 2.0-0731    DS508      DSM 4.0-2265      DS411+II  DSM 6.2.4-25556-8   DS115J    DSM 7.1.1-42962-5   DS918+    DSM 6.2.4-25556-8
DS107+     DSM 3.1-1639    DS411slim  DSM 6.2.4-25556   DS213J    DSM 6.2.4-25556-7   DS1515+   DSM 6.2.4-25556-8   DS220+    DSM 7.2.2-72806-2
DS107+     DSM 3.1-1639    DS111      DSM 5.2-5967-9    DS413J    DSM 6.2.3-25426-2   DS716+II  DSM 7.2.2-72806-2   RT2600ac  SRM 1.3.1-9346-12
BeeDrive   1TB             BeeServer  BSM 1.2-65567                                                                 MR2200ac  SRM 1.3.1-9346-12

Offline Hutje

  • MVP
  • *
  • Bedankjes
  • -Gegeven: 202
  • -Ontvangen: 221
  • Berichten: 1.811
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #2 Gepost op: 29 december 2015, 16:45:35 »
Ik ervaar hetzelfde met SABnzbd.
Echter wordt e.e.a. WEL goed uitgepakt.
Alleen blijven de individuele RAR files achter. die niet weg willen.
Oplossing is om complete folder in File Station te verwijderen.
Lastig is het wel, zodra e.e.a. niet meer 'automatisch' normaal gaat.

Misschien eens een berichtje richting die release groep ?


DS1515+  [3x 8TB + 1x 4TB + 1x 3TB]  8 GB DDR3 DSM 6.1.7-15284 Update 3
DS1512+  [3x 4TB + 2x 2TB]  4 GB DDR3 DSM 6.1.7-15284 Update 3
DS411j     [3 x 2TB SHR] DSM 6.1.7-15284 Update 3
DS211j     [TEST-NAS] DSM 6.1-15101
RT1900    [AP-mode] SRM 1.2-7742
UPS          APC Back-UPS ES 700G

Stephan296

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #3 Gepost op: 29 december 2015, 17:40:25 »
Ik heb in ieder geval even mijn "locale" aangepast aangezien ik ook een probleem had met mijn leestekens op websites zoals spotweb.
Nu heb ik wel een rename pp-script gevonden, maar ik krijg het nog niet voor elkaar om deze voor het unrar proces uit te laten voeren.

Ben nog druk met google aan het stoeien ;-)

Ben(V)

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #4 Gepost op: 29 december 2015, 17:41:16 »
Zoals je in de link die Birdy al geplaatst had kunt lezen heb ik een python scriptje aangpast zodat je daarmee een folder (+subfolder) kunt scannen en dan worden alle onleesbare tekens eruit gehaalt.
zie:
http://www.synology-forum.nl/optware-ipkg-telnet/(handleiding)-renamen-van-bestanden-met-vreemde-tekens/msg140985/#msg140985

Het probleem is dat er (vaak windows-1252) code pages gebruikt worden om die rar bestanden te maken en dat alle systemen (behalve windows) tegenwoordig met utf-8 werken.

UTF-8 is voor alle ascii karakter gelijk( code 32 t/m 127) aan zowel ascii als windows-1252, maar voor alle overige karakters(in alle talen) gebuikt hij twee bytes.

Het codepage systeem gebruikt de overige codes van een byte (0 t/m 32 en 128 t/m 255) om "vreemde" tekens te maken en dan moet je ook nog weten welke code page gebruikt is.

Een utf-8 systeem snapt daar niets van en met geluk maakt hij er iets leesbaars van maar vaak negeert hij het dan.

Op zich is het niet zo moeilijk om een conversie te maken, maar er zijn vele code pages en als je niet weet welke gebruikt is om het rar bestand te maken blijft het gokken.

Mijn advies is om torrents te gebruiken, die release groepen gebruiken gewoon utf-8.

Stephan296

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #5 Gepost op: 29 december 2015, 18:41:02 »
Dat script had ik zeker gezien en ook uitgeprobeerd, echter wil ik het in nzbget draaien, na de par check maar voor het unrar proces.
Gewoon een uitdaging ;-)

Ben(V)

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #6 Gepost op: 29 december 2015, 19:49:14 »
Voor het unrar proces lijkt me niet zo zinvol.
Als er in die rar bestandsnamen zitten met diakritiche karakter namen loop je alsnog vast.

Offline Birdy

  • Global Moderator
  • MVP
  • *
  • Bedankjes
  • -Gegeven: 1399
  • -Ontvangen: 8046
  • Berichten: 44.169
  • Fijne feestdagen.......
    • Truebase
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #7 Gepost op: 29 december 2015, 19:54:57 »
Misschien wel zinvol als de rar file namen zelf al die tekens heeft ?


CS406      DSM 2.0-0731    DS508      DSM 4.0-2265      DS411+II  DSM 6.2.4-25556-8   DS115J    DSM 7.1.1-42962-5   DS918+    DSM 6.2.4-25556-8
DS107+     DSM 3.1-1639    DS411slim  DSM 6.2.4-25556   DS213J    DSM 6.2.4-25556-7   DS1515+   DSM 6.2.4-25556-8   DS220+    DSM 7.2.2-72806-2
DS107+     DSM 3.1-1639    DS111      DSM 5.2-5967-9    DS413J    DSM 6.2.3-25426-2   DS716+II  DSM 7.2.2-72806-2   RT2600ac  SRM 1.3.1-9346-12
BeeDrive   1TB             BeeServer  BSM 1.2-65567                                                                 MR2200ac  SRM 1.3.1-9346-12

Stephan296

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #8 Gepost op: 29 december 2015, 19:56:27 »
Hij wil hem niet uitpakken omdat die rar files die tekens bevatten. Daarom wilde ik hem voor het unrar proces laten renamen.

Gemarkeerd als beste antwoord door Gepost op Vandaag om 10:57:36

Offline Birdy

  • Global Moderator
  • MVP
  • *
  • Bedankjes
  • -Gegeven: 1399
  • -Ontvangen: 8046
  • Berichten: 44.169
  • Fijne feestdagen.......
    • Truebase
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #9 Gepost op: 29 december 2015, 19:57:57 »
  • Beste antwoord ongedaan maken
  • Dat schrijf ik  :lol:


    CS406      DSM 2.0-0731    DS508      DSM 4.0-2265      DS411+II  DSM 6.2.4-25556-8   DS115J    DSM 7.1.1-42962-5   DS918+    DSM 6.2.4-25556-8
    DS107+     DSM 3.1-1639    DS411slim  DSM 6.2.4-25556   DS213J    DSM 6.2.4-25556-7   DS1515+   DSM 6.2.4-25556-8   DS220+    DSM 7.2.2-72806-2
    DS107+     DSM 3.1-1639    DS111      DSM 5.2-5967-9    DS413J    DSM 6.2.3-25426-2   DS716+II  DSM 7.2.2-72806-2   RT2600ac  SRM 1.3.1-9346-12
    BeeDrive   1TB             BeeServer  BSM 1.2-65567                                                                 MR2200ac  SRM 1.3.1-9346-12

    Stephan296

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #10 Gepost op: 29 december 2015, 20:09:38 »
    Dat zeg ik: Gamma

    Ben(V)

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #11 Gepost op: 29 december 2015, 20:12:20 »
    In dat geval moet het sript twee keer gedraait worden.

    Ik weet het niet meer zeker(heb er een hele tijd geleden eens naar gekeken) maar nzbget heeft toch op verschillende plaatsen mogelijkheden om externe scripts aan te roepen?
    Als dat op het juiste moment kan en de bestandsnaam van het rar bestand via zo'n enviroment variable is op te pikken is kan ik wel een scriptje voor je maken die de bestandsnaam omzet naar utf-8.

    Zal er morgen wel eens naar kijken, ik heb dat probleem ook al eens opgelost voor autosub als die subtitles in een zip file download, met diakritische karakters in de subs.

    Gaat het wel om rar of zip bestanden?

    Stephan296

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #12 Gepost op: 29 december 2015, 20:16:47 »
    Het gaat in dit geval om rar bestanden.
    Moet alleen kijken hoe ik dat script voor het rar proces krijg.
    Ik heb wel een idee alleen nog niet getest.
    Om een script te maken die zowel het renamen als het unrarren aanroept.
    Dit script dan bij de instellingen aan te roepen waar de binary unrar wordt aangeroepen.
    Snap je het nog ;-)

    Ben(V)

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #13 Gepost op: 29 december 2015, 20:34:16 »
    Heb even in de wiki van nzbget zitten lezen.
    Je kunt een nzbget een postprocess script laten aanroepen die het een en ander voor je doet.

    Ik zal kijken of ik een script kan maken die de de naam van de .rar omzet naar utf-8 alsmede de .rar uitpakt en de bestandsnamen daarin ook naar utf-8 omzet.
    Moet even zo'n bestand zien te vinden(of te maken) om te kunnen testen.

    Stephan296

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #14 Gepost op: 29 december 2015, 20:37:06 »
    Ik heb wel een nzb voor je als je wilt.


     

    Bestanden verplaatsen

    Gestart door raptileBoard SickBeard

    Reacties: 11
    Gelezen: 4552
    Laatste bericht 22 oktober 2012, 23:47:40
    door raptile
    Bestanden weg maar geen "bewijs" in logboeken.

    Gestart door PuffBoard NAS hardware vragen

    Reacties: 7
    Gelezen: 3718
    Laatste bericht 15 december 2013, 22:45:48
    door Puff
    mappen en bestanden delen

    Gestart door brejenBoard Synology DSM algemeen

    Reacties: 14
    Gelezen: 8492
    Laatste bericht 11 juni 2015, 09:06:59
    door Ben(V)
    Hulp gevraagd, welk model NAS beste voor het grote bestanden uit nieuwsgroepen

    Gestart door MicaveBoard Aankoopadvies

    Reacties: 13
    Gelezen: 5244
    Laatste bericht 09 januari 2016, 09:11:26
    door Micave
    Geen bestanden zien via Sony KDL-40CX520

    Gestart door PandionBoard Media Server (UPNP/DLNA)

    Reacties: 3
    Gelezen: 2631
    Laatste bericht 01 oktober 2011, 19:42:41
    door Stifke