多线程下对一个串多次调用strok后strlen报段错误



 while(1)
{
    char buf[800] ={0};
    ret=fgets(buf, sizeof(buf) -1, fp);
    if(!ret){ 
    ...lseek to head of file
    continue;
    }
    //问题很可能出在这里,改成strtok_r还是会同样出错
    char *url=strtok(buf,"\n");
    index++;
    thread=&stk_threads[index];
    stk_thread_push_task(thread, url);

    if(++index==max_thread)
    {
       index=0;
    }
}

先贴代码如上,问题如下
程序在对一个文件遍历一段时间(我确定还没遇到过尾部)之后,在push到选定thread的队列时【主程序会用strlen判断url处(来源指针)的字串长度,从而拷贝一份出来,防止各线程读到重复的url内容】在strlen时候报段错误。

我知道strtok的实现原理,但是不明白这个段错误在这个情形下发生的具体原因是什么呢?【注意,执行strtok和push到选定线程以及调用strlen拷贝源串的都是主线程自己】

c 多线程 字符串处理 C++

永远的僚机 10 years, 2 months ago

我的理解是: char buf[800] 分配在主线程的栈空间上, 而每次 strtok 后, url 指向 buf 的地址. 所以对 子线程来说, 这里存在 Cross-thread Stack Access .

https://software.intel.com/sites/products/documentation/hpc/inspectorxe/en-us/2011Update/lin/ug_docs/GUID-F0B0D34B-6691-4033-931F-4BBBD1A1F791.htm

strtok_r 无济于事. 试着 每次在把 url 的内容 在堆里拷贝一份, 传给 子线程, 然后 delete 掉.
当然更好的办法是在 线程 数据结构里 给 url 分配相应的内存.

八雲チェン answered 10 years, 2 months ago

url 是指向一个全局共享内存,你的线程还没有处理,push 到队列里面的指针就已经被下一次 strtok 调用给破坏掉,如果再访问这些指针就会段错误。

改用 strtok_r 就好了。

黑锅218 answered 10 years, 2 months ago

Your Answer