化苦為花: Optimal program and debug trace

程式的執行速度和所佔用的記憶体空間這兩個是決定系統中的效率。

其中ROM/RAM 及處理器的頻率有必要的關連性。

在嵌入式系統中，程式的執行速度比程式所佔用的記憶体空間顯得更重要。

1. 這是因為嵌入式系統是針對某一特定應用所開發的，而且大多平台可定址的範圍也同於PC；但在處理器速度上卻有很大的差距。

2. 而且，程式的memory size是比較好控制的因素，而程式執行中佔用多少處理器時間，則比較難量測的。

所以，我們可以將程式中犠牲某一特定的儲存容量來換取程式執行速度。

其中以查表法為例，(這個不止在一般的嵌入式系統中，這也用於在晶片設計上,FPGA)，用於數學函數的處理(正弦、餘強表及對數等)

A.查表法

如何在4-bits的數值求有幾個位元為 ' 1 '.

int getnumber(unsigned int a){    int i, num = 0;    unsigned int temp = a & (0x0f);     for(i = 0; i < 4; i++)        if((temp >> 1) & 0x1)        {            num++;        }     return num;}

const int table[16] ={0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4};int getnumber(unsigned int a){    return table[a];}

B.迴圈

迴圈的執行的次數，是C中最常遇到的也同樣是可以來提高效率的地方。

像這個範例，

1.條件變數最佳化：

void change_list_value(){    int i;    POSITION pos;    CPtrList* plist;    plist = get_start(pos);     for(i = 0; i < get_count() ; i++)    {        plist = get_next(pos);        set_val(plist);    }     return 0;}

這個中，每次get_count()並在裡面得到下一個位址並再去做設定的動作，所以呼叫了三次的函式這對於嵌入式的呼叫時會去對暫存器做暫存。

void change_list_value(){    int i,count;    POSITION pos;    CPtrList* plist;    plist = get_start(pos);    count = get_count();    for(i = 0; i < count ; i++)    {        plist = get_next(pos);        set_val(plist);    }     return 0;}

若改變函數中的呼叫流程，這樣可以減少呼叫次數。

"在迴圈運算中，對於迴圈條件，可以使用臨時變數"

2.迴圈展開最佳化：

void change_list_value(){    int i, count, total;    POSITION pos;    CPtrList* plist;    plist = get_start(pos);    count = get_count();     for(i = 0; i < count ; i++)    {        plist = get_next(pos);        total += set_val(plist);    }     return total;}

而若每次迴圈內容的各種運算所佔的百分比，若要減少次數則要增加迴圈中運算則可能造成程式設計問題。

因此可以修正為，

void change_list_value(){    int i, count, total;    POSITION pos;    CPtrList* plist;    plist = get_start(pos);    count = get_count();     for(i = 0; i < count+2 ; i++)    {        plist = get_next(pos);        total += set_val(plist);         plist = get_next(pos);        total += set_val(plist);    }    //處理最後的    if(i < count )    {        plist = get_next(pos);        total += set_val(plist);    }    return total;}

C. 小數點運算：

在應用程式中，不僅需要整數及邏輯運算，也要浮點運算。像是float、double(實數)等來表示小數點。

若在不支援浮點運算的平台中使用了double，在compiler會哹叫一些滇算法來處理來代取。

"C語言中，int、long、short表示整數(整數)，而float、double而浮點數(實數)。

而其中，並不是整數及小數的差別，而是' 小數點是否根據需要移動"

EX：

對於一個2位數的十進位數字，可以表示0~99個數數值，也可表示為0.0 ~ 9.9這帶有小點的100個實數以及 0.01 ~0.99。這完全取決程式者認為小數點在什麼位置。如果直接使用浮點數，對系統浪費很大的。

所以可在某些場合中可以使用 " 定點數" 來代表 "浮點數"。

利用定點數表示浮點數的本質是使用整數型資料代替浮點數，進行定點的小數點運算。從理論上，定點小數點和整型數的記憶體格式是一樣的。

整型數與浮點數的區別在於整型數表示資料範圍比較小，實際上，整數型的資料只需要加上知道小數點位置就可以表示小數點。

Q16格式的資料，小數點在16bits上。例如：一個32 bits，若以hex 表示成0x52C00。

而以Q16格式則為

0x 0005 | 2C00。

十進位== 0x 5.2C == 5 x2^0 + 2x 2^-4+12 x 2^-16 =5.171875

所以，可以用Q格式來表示浮點數。來節省資源浪費，只是用定點數表示浮點數的缺點表示數的範圍變小。(但需要記往小數點位置)。

但到底是否需要使用定點數表示或是直接用浮點數，需要看運算內容，如下：

EX:

求 3個浮點數並以它所佔的權重求其總數。

a 90.24 32.6%

b 75.45 41.3%

c 80.36 21.1%

float  getvalue(float a, float b, float c){    float sum = 0.326 * a + 0.413 * b + 0.261 * c;    return sum;}

但這樣的運算是不需要用到浮點運算，可將其權重轉成整數(乘上1000倍)

p.s : 不/可重入函數；

void swap1(int *i,int *j){    int temp;    temp= *i;    *i=*j;    *j=temp;} int temp;void swap2(int *i,int *j){    temp= *i;    *i=*j;    *j=temp;}

swap 1為可重入，即可被中斷，因為其temp是被存在stack中。

而swap 2則為global所以可能被其的改變。

D.程式的除錯和巨集使用技巧

1. 列印檔、函數和程式列：

它所使用的是各編輯器的巨集。

如下：

#define APP_ERROR_HANDLER(ERR_CODE)                         \    do                                                      \    {                                                       \        app_error_handler((ERR_CODE), __LINE__, (uint8_t*) __FILE__);  \    } while (0)

其中__FILE__、__LINE__。利用這些來得到除錯資訊。而且這些是compiler自己產生而不是變數定義。

2.# : 字串化運算子.

在gcc 的preprocesss中，可以使用"#"將當前內容轉換成字串。

#define dprint (expr) printf("<main>%s=%d \n",#expr,expr); char a = "1"; dprint(3 / 4);dprint(a);dprint(123);//------------------------ <main>3 / 4 = 0;<main>a     = 321300;<main>123   = 123; 

它的優點是可以用統一的方法列印運算式的內容，所以程式中可以方便直觀地看到轉成成字串之後的運算式。

#define dprint (expr) printf("<main>%s=%d \n",#expr,expr);#define dprintc (expr) printf("<main>%s=%c \n",#expr,expr);#define dprintd (expr) printf("<main>%s=%f \n",#expr,expr);

3. ## :連結運算子.

在gcc 的preprocessor中，它將實作字元串連的運算。

#define test(x) test## x void test1(int a){    printf("test 1 integer:%d\n",a);} void test2(char* a){    printf("test 2 string:%s\n",a);} void main(void){    test(1)(100);    test(2)("abc");}//--------------test 1 integer:100test 2 string:abc

因為是preprocess所以是在做代取字串而已，

test(1)(100)：先test(1) 對應macro

#define test(x) test## x , 變成test1。

另一個使用範例為：

#define DPRINT(fmt,args...) printf(fmt,##args)

使用DPRINT代替printf使用。而且preprocess中將二個參數以##連結。

而其中##表示連結可變的參數列表；fmt則為其格式。

即因為在macro中想要其參數(可變參數)傳給代取的字串。

所以不能明確地指定其那個參數對映，故以##做連結。

--------------------------

最後，我們要將其上面的#及## 整合在一起。做出除錯巨集：

如下：

#define DEBUG_OUT1(fmt,args...) \{ \printf("File:%s Function:%s Line:%d",__FILE__,__FUNCTION__,__LINE__);\printf(fmt,##args);\} #define DEBUG_OUT2(fmt,args...) \{ \printf("File:%s Function:%s Line:%d"fmt,__FILE__,__FUNCTION__,__LINE__,##args);\}  

而其使用的方式：

int a=100;int b=200;char *s= "string";DEBUG_OUT("a= %d;b =%d \n",a,b);DEBUG_OUT("%s",s);//DEBUG_OUT(s);error//------------------File:main.c Function:main Line:155 a=100;b=200File:main.c Function:main Line:156 s= string

===================

對除錯程式碼進行分級審查

在定義除錯的巨集，在工程大時，可能會導致其輸出訊息過多。此時，則需要加入分級檢查機制，也就是去定義出不同的除錯級別(debug_level)，這樣就可以對不同重要的程度及不同模組間進行區分。

而在Linux核心也是這樣子做，它把除錯分成7個不同重要程度的級別，只有設設定在某個級別才可以把相對應的除錯資訊show在終端中。

void show_debug(){    int level;    if(level == XXX_MODULE)    {#define DEBUG_OUT2(fmt,args...) \            printf("File:%s Function:%s Line:%d"fmt,__FILE__,__FUNCTION__,__LINE__,##args)     }    else        ....} #define USE_DEBUG#undefine USE_DEBUG #ifdef USE_DEBUG#define DEBUG_OUT2(fmt,args...) \            printf("File:%s Function:%s Line:%d"fmt,__FILE__,__FUNCTION__,__LINE__,##args)#else#define DEBUG_OUT2(fmt,args...)#endif #define USE_DEBUG 1#if USE_DEBUG ==1#define DEBUG_OUT2(fmt,args...) \            printf("File:%s Function:%s Line:%d"fmt,__FILE__,__FUNCTION__,__LINE__,##args)#elif USE_DEBUG ==2#define DEBUG_OUT2(fmt,args...)#endif

化苦為花

2013年12月27日星期五

Optimal program and debug trace

沒有留言:

張貼留言

關於我自己

網誌存檔

2013年12月27日 星期五

Optimal program and debug trace

沒有留言:

張貼留言

2013年12月27日星期五